大数据:从入门到XX(一)
?? 因為不小心被大數據撞了一下腰,這兩天有點小郁悶,前思后想了一番,還是決定在工作之余,臨時抱抱大數據的佛腳,以備吹牛之用。
?? 大數據到底現在有多熱呢,沒有研究就有發言權哪,還是看看國家權威發布吧。我上網查了一下,發現主席在2014年的大會上就提到了:“大數據、云計算、移動互聯網等新一代信息技術同機器人技術相互融合步伐加快”。這都是兩年前的話了,兩年后的今天,大數據已經發展到什么階段了呢,我還是抄近路去看個究竟把。
?? 一提起大數據,首先想到的就是HADOOP了,然后就是APACHE,然后就是免費。為了一探究竟,還得先從APACHE談起。為了避免被二手資料誤導,我先去官網APACHE Project Directory逛了逛(一開始用的是寬帶上網,頁面在不停的打轉,后來換成移動4G的信號才行,看來盆子不能都扣到防火墻頭上啊)。以下就是官網顯示的部分內容。
Project listings:
???By Name
???By PMC
???By Category
???By Programming Language
???By Number of Committers
? 其它的內容不一一貼了,老外網站上顯示的內容也不太符合中國人的習慣,我用數據分析的方法調整了一下展示方式。
? 目前APACHE上一共有330個項目(官網顯示333個,但有3個重復顯示了:Apache DataFu (Incubating)、Apache Quarks (Incubating)、Apache Taverna (Incubating))。
? 下表是按照項目的功能進行分類展示,其中有些項目同屬于多個category。
| RANK | CATEGORY | QTY. |
| 1 | library | 93 |
| 2 | network-server | 39 |
| 3 | big-data | 36 |
| 4 | xml | 31 |
| 5 | web-framework | 27 |
| 6 | database | 25 |
| 7 | network-client | 25 |
| 8 | retired | 23 |
| 9 | build-management | 20 |
| 10 | content | 17 |
| 11 | http | 15 |
| 12 | cloud | 12 |
| 13 | javaee | 10 |
| 14 | osgi | 6 |
| 15 | graphics | 5 |
| 16 | testing | 5 |
| 17 | httpd-module | 4 |
| 18 | Library | 3 |
| 19 | hadoop | 3 |
| 20 | security | 3 |
| 21 | identity-management | 3 |
| 22 | SDK | 2 |
| 23 | 2 | |
| 24 | regexp | 2 |
| 25 | mobile | 2 |
| 26 | identity-provisioning | 2 |
| 27 | Kerberos | 1 |
| 28 | sql | 1 |
| 29 | virtual-machine | 1 |
| 30 | OSGi | 1 |
| 31 | ftp | 1 |
| 32 | composite-oriented-programming | 1 |
| 33 | Framework | 1 |
??? 從上表可以看出,目前大數據相關的開源項目有36個,排在第3位,big data+cloud+hadoop總共有51個開源項目,看來大數據、云計算家族確實人丁興旺。
?? 下表是各個項目所用的開發語言或者支持的語言,從中也大致能了解到語言的流行程度。
| RANK | CATEGORY | QTY. |
| 1 | Java | 224 |
| 2 | C | 21 |
| 3 | Python | 18 |
| 4 | JavaScript | 14 |
| 5 | C++ | 14 |
| 6 | Scala | 12 |
| 7 | C# | 11 |
| 8 | Perl | 9 |
| 9 | PHP | 7 |
| 10 | Ruby | 7 |
| 11 | XML | 5 |
| 12 | Groovy | 3 |
| 13 | Go | 3 |
| 14 | SQL | 3 |
| 15 | ActionScript | 2 |
| 16 | Erlang | 2 |
| 17 | Tcl | 2 |
| 18 | Bash | 2 |
| 19 | Node.JS | 2 |
| 20 | ODBC | 1 |
| 21 | OCaml | 1 |
| 22 | Delphi | 1 |
| 23 | SVG | 1 |
| 24 | JSP | 1 |
| 25 | D | 1 |
| 26 | SmallTalk | 1 |
| 27 | Haskell | 1 |
| 28 | Freemarker | 1 |
| 29 | JDBC | 1 |
| 30 | Objective-C | 1 |
| 31 | Cocoa | 1 |
??? 從上表可以看出APACHE上開發語言的使用情況,除了老三樣 C (含C++)、JAVA、JavaScript,另外還包括了Python和Scala也都排進了前六名。至于大數據相關的幾個項目,都用到了什么樣的開發語言,下一篇再聊。
轉載于:https://blog.51cto.com/sjinqun/1790714
總結
以上是生活随笔為你收集整理的大数据:从入门到XX(一)的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Html5必看:教你如何选择移动APP开
- 下一篇: javascript:闭包的总结