2021年大数据Hadoop(二):Hadoop发展简史和特性优点
2021大數據領域優質創作博客,帶你從入門到精通,該博客每天更新,逐漸完善大數據各個知識體系的文章,幫助大家更高效學習。
有對大數據感興趣的可以關注微信公眾號:三幫大數據
目錄
Hadoop發展簡史
Hadoop特性優點
Hadoop發展簡史
Hadoop是Apache Lucene創始人 Doug Cutting?創建的。最早起源于Nutch,它是Lucene的子項目。Nutch的設計目標是構建一個大型的全網搜索引擎,包括網頁抓取、索引、查詢等功能,但隨著抓取網頁數量的增加,遇到了嚴重的可擴展性問題:如何解決數十億網頁的存儲和索引問題。
2003年Google發表了一篇論文為該問題提供了可行的解決方案。論文中描述的是谷歌的產品架構,該架構稱為:谷歌分布式文件系統(GFS),可以解決他們在網頁爬取和索引過程中產生的超大文件的存儲需求。
2004年 Google發表論文向全世界介紹了谷歌版的MapReduce系統。
同時期,以谷歌的論文為基礎,Nutch的開發人員完成了相應的開源實現HDFS和MAPREDUCE,并從Nutch中剝離成為獨立項目HADOOP,到2008年1月,HADOOP成為Apache頂級項目,迎來了它的快速發展期。
2006年Google發表了論文是關于BigTable的,這促使了后來的Hbase的發展。
因此,Hadoop及其生態圈的發展離不開Google的貢獻。
Hadoop特性優點
擴容能力(Scalable):Hadoop是在可用的計算機集群間分配數據并完成計算任務的,這些集群可用方便的擴展到數以千計的節點中。
成本低(Economical):Hadoop通過普通廉價的機器組成服務器集群來分發以及處理數據,以至于成本很低。
高效率(Efficient):通過并發數據,Hadoop可以在節點之間動態并行的移動數據,使得速度非常快。
可靠性(Rellable):能自動維護數據的多份復制,并且在任務失敗后能自動地重新部署(redeploy)計算任務。所以Hadoop的按位存儲和處理數據的能力值得人們信賴。
- 📢博客主頁:https://lansonli.blog.csdn.net
- 📢歡迎點贊 👍 收藏 ?留言 📝 如有錯誤敬請指正!
- 📢本文由 Lansonli 原創,首發于 CSDN博客🙉
- 📢大數據系列文章會每天更新,停下休息的時候不要忘了別人還在奔跑,希望大家抓緊時間學習,全力奔赴更美好的生活?
總結
以上是生活随笔為你收集整理的2021年大数据Hadoop(二):Hadoop发展简史和特性优点的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 2021年大数据Hadoop(一):
- 下一篇: 2021年大数据Hadoop(三):Ha