當前位置：首頁 > 编程资源 > 编程问答 >内容正文

编程问答

探秘HDFS —— 发展历史、核心概念、架构、工作机制（上）｜博文精选

發布時間：2024/9/27 编程问答 27 豆豆

生活随笔收集整理的這篇文章主要介紹了探秘HDFS —— 发展历史、核心概念、架构、工作机制（上）｜博文精选小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

戳藍字“CSDN云計算”關注我們哦！

作者 |??Mr-Bruce
轉自｜ CSDN博客責編 | 阿禿

幾周前，筆者做了一個與HDFS有關的技術分享，以知識普及為目的，主要分享了Hadoop發展歷史、HDFS核心概念、整體架構、工作機制等內容。本文大部分內容來自于當時的Slides，分上下兩篇闡述。

HDFS，全稱Hadoop Distributed File System，顧名思義，是Hadoop里面的分布式文件系統。在諸多大數據架構設計中，都能看到最底層是HDFS，用于數據的持久化。在Hadoop系統中（以2.7.3版本為例），HDFS只是其中一個組件，另外三個組件分別是：YARN，負責集群的資源管理；MapReduce，大數據計算引擎；Hadoop Common，相關公共庫。從架構拆分和接口通用化的角度來看，這四個組件都設計的很好，盡管最近幾年MapReduce逐漸被Spark、Flink這樣綜合型的內存型計算引擎替代，但是其他三個組件依然被廣泛使用在各種業務場景。

筆者所在的大數據項目主要使用Spark作為計算引擎，數據存放在AWS S3中，HDFS并沒有被重度使用，主要用在以下三個場景，用來保證Spark Streaming處理過程中的數據完整性（不多、不少）。

為了保證在處理過程中Crash后，程序能恢復起來繼續處理，需要記錄Spark Streaming Checkpoint數據；
為了保證已經接收、尚未處理的數據不丟失，需要依靠Spark Streaming WAL機制，即將接收的數據持久化；
為了保證一段時間內沒有重復數據，需要記錄歷史數據的Hash值。

因為HDFS并不是整個項目的核心，所以參照業界用法就去用了，也沒有詳細的研究。上線后一年半時間內，陸續發生了5個與HDFS相關的CASE，占了近一半。且不論是否應該在上述場景去用HDFS，就發生的問題來看，主要是因為我們當時對HDFS的認知不夠。因此，這里跟大家分享些筆者當前對HDFS的部分認識，期望能幫助到同道中人。

Hadoop發展歷史

在了解HDFS是什么、怎么工作之前，先來看看HDFS是在什么樣的業務場景下被創造出來的。筆者這里整理了2012年之前Hadoop的發展歷史，這一時間段也是Hadoop從萌生到飛速發展的階段。要談Hadoop的發展歷史，就不得不提到一個人：Doug Cutting，他是Apache Lucene、Nutch、Hadoop、Avro的創始人，為Apache社區作出了重要貢獻，目前在Cloudera擔任首席架構師。有意思的是，Hadoop的名字，就是他以自己兒子的一個玩具名來命名的。

階段一：孵化

上個世紀90年代，互聯網信息開始呈現爆炸式增長，“搜索”成為一個熱門方向。1997年，Doug開始研發Lucene項目，一個全文搜索引擎庫。比如，有100篇文章，給一個關鍵詞“飛機”，從中搜索出包含關鍵詞的文章。要實現這個功能，需要先將每篇文章分詞，建立倒排索引，然后根據關鍵詞來匹配打分，從而找出相關的文章。目前如日中天的Elasticsearch技術，便是基于Lucene來實現的，可見該項目的前瞻性與實用性。2001年，Doug將Lucene開源到Apache，之后很快成長為TOP項目。

2002年，Doug開始研發Nutch項目，用于爬取全網信息，然后用Lucene建立索引，從而提供互聯網搜索。但是，單靠一臺機器是無法處理全網信息的。于是，Doug開始研究如何利用多臺機器協調起來同時處理，即分布式存儲與計算技術。到2003年底，他實現了用四臺機器來處理信息。但是，面對爆炸式的全網信息，四臺機器還是太少了，而他的架構已經無法支持進一步擴展。就在Doug一籌莫展時，Google發表了論文Google File System，闡述了Google內部對分布式文件系統的理解和實現方式。

2004年，Doug根據GFS論文的指導，在Nutch項目中實現了DFS系統，這就是最早版的HDFS，只是當時叫NDFS。有了分布式存儲系統后，Doug開始思考如何在這樣的底層存儲上來重構之前的計算引擎，而就在年底，Google又發表了MapReduce論文。2005年，Doug實現了Nutch MapReduce，并基于MapReduce對Nutch進行了重構。

階段二：出世與成長

2006年，是Hadoop正式面世的一年。這一年，Doug將DFS和MapReduce從Nutch項目中剝離，組建了Hadoop項目。同年，Yahoo!開始全面轉移到Hadoop陣地，并聘請Doug作為項目轉型的架構師。到年底，Yahoo!的Hadoop集群達到了600臺機器。

2007年，Twitter、Facebook、LinkedIn相繼加入Hadoop陣營。同年底，Yahoo!的集群達到1000臺機器。

2008年，是Hadoop發展很重要的一年。這一年，Hadoop成長為Apache Top項目，HBase、Hive、Pig、Zookepper等基于Hadoop的項目相繼誕生，并貢獻給開源社區，整個Hadoop的生態體系構成。同年，一個新興的公司Cloudera成立，基于Hadoop提供專業的解決方案。

2009年，Amazon提供EMR云服務，用戶不用擔心機器的維護、擴展，只需要關注自己的業務（PS：筆者當前的大數據服務都是跑在EMR中的）。同年8月，Doug加入Cloudera。2011年，另一家公司Hortoworks成立，跟Cloudera一樣，提供大數據解決方案。

階段三：飛升

2012年，Hadoop迎來了一次大的改動，成為Hadoop v2。除了很多接口、內部實現的優化外，最重要的是兩點：

將YARN分拆出來，作為獨立的資源管理模塊；
構建HDFS的HA和Federation解決方案，提高HDFS的高可用和擴展性。

到這一年底，Yahoo!的集群達到了42000臺機器。2012年之后，到2016年，Hadoop平穩發展，被越來越多的公司引入使用。

總結來說，Hadoop是由Doug創建，最初是為了解決全網信息爬取與處理的問題，后來被Yahoo!發揚光大，在全社區的貢獻下迅速構建了自己的生態體系，對大數據處理的發展影響深遠。值得一提的是，隨著云存儲和諸如Spark、Flink這樣內存型計算引擎的快速發展，2016年之后，Hadoop開始逐漸走下坡路。

核心概念

HDFS有兩個核心特征：分布式、文件系統。從文件系統的角度來看，HDFS提供了一個統一的命名空間——目錄樹來組織文件，其操作命令的形式跟Linux操作系統基本保持一致，比如下圖中的"hdfs dfs -ls /"命令。目錄樹，是邏輯上的概念，用來屏蔽底層復雜的存儲和相關操作的細節，讓用戶感覺像在操作本地文件系統一樣。

從分布式的角度來看，一個文件可能會被切割成多個數據塊，分散存儲到多臺機器上。數據塊，是物理上的概念，決定了文件的具體存儲形式。以下圖為例，文件"7572c-4427-81e1-bd111c6f01720.parquet" 大約500MB，會被分割為4個Block（默認一個Block的大小為128MB），假設集群有2臺機器，就會每臺機器分配兩個Block。另一方面，Hadoop在設計和使用上，有一個前提：允許集群中少量機器在某個時刻發生故障。為了達到這個目的，需要將文件拷貝多份放在不同的機器上，即Replica。比如，這里的2臺機器，會分別備份另一臺機器上的數據塊（Replica設置為2）。

為什么需要引入數據塊？其實是我們常說的“分而治之”的思想。假設沒有數據塊，直接以整體的形式存儲一個文件，就容易出現下面問題：

集群中的機器使用不均勻。比如將一個20GB的文件完整存放到機器A上，勢必會導致機器A的負載更重。
故障恢復慢。對于一個20GB文件，如果所在的某臺機器故障了，整個系統需要重新搬移數據，保持足夠的Replica時，需要一次性移動20GB的數據，會帶來較高的負載。
無法并行加載文件。文件作為整體存儲時，很難利用并行計算的優勢來并行加載文件。

下圖所示為一個數據塊（Block）的相關信息，上面部分是在WebHDFS UI上看到的信息，下面部分是該數據塊具體所在的機器上的信息。對于每一個數據塊，都有一個映射關系：文件名稱（包括路徑） -> Block Id -> Block所在機器，這個關系對數據塊的維護至關重要。

架構

HDFS的架構，可以從兩個角度來看：一個是由哪些組件構成，一個是組件之間如何通信。整個HDFS系統包含Client和Server兩部分：Client是發起操作的一方，可以是HDFS自帶的工具，也可以是通過API調用的程序（第三方庫、業務程序等）；Server是提供存儲服務的一方，包括一個Name Node和多個Data Node。Name Node負責維護文件目錄樹、Block映射關系等元信息，Data Node負責具體的數據存儲。綜合來看，系統由三部分組成：Client、Name Node、Data Node。

這三個組件之間的通信關系，可以歸納為三方面：

Client向Name Node、Data Node發起通信。Client發起的文件操作主要為讀、寫、修改屬性，這些操作都會先跟Name Node交互，拿到返回信息后根據情況向相應的Data Node發起交互。

Data Node向Name Node發起通信。Data Node會定期向Name Node發送Heartbeat、Block Report信息，Name Node收到后作出判斷，并返回相關指令給Data Node，Data Node收到返回結果后，會根據情況做出進一步操作。Name Node不會主動向Data Node發起通信，只是被動地響應Data Node的通信。

Data Node之間的通信。Data Node之間在某些特定場景下會相互交互，比如寫操作時的數據復制、節點均衡時的數據移動。

這些通信關系是整個HDFS工作的核心，下一節筆者將進一步闡述在其之上的各種工作機制。

掃描下方二維碼，查看原博主精彩分享???

福利掃描添加小編微信，備注“姓名+公司職位”，入駐【CSDN博客】，加入【云計算學習交流群】，和志同道合的朋友們共同打卡學習！

推薦閱讀：

亞馬遜消費者業務宣布永久關閉 Oracle 數據庫，去O新進展；華為發布最新5G全系列解決方案；蘋果正研究新設備“智能戒指”……
當我們在聊 Serverless 時你應該知道這些｜ CSDN博文精選
只因寫了一段爬蟲，公司 200 多人被抓！
確認！語音識別大牛Daniel Povey將入職小米，曾遭霍普金斯大學解雇，怒拒Facebook
三年一跳槽、拒絕“唯學歷”，火速 Get 這份程序員求生指南！
最新報告：區塊鏈應用程序交易量下降近40%，博彩類仍為最受歡迎項目……
真香，朕在看了！

總結

以上是生活随笔為你收集整理的探秘HDFS —— 发展历史、核心概念、架构、工作机制（上）｜博文精选的全部內容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯，歡迎將生活随笔推薦給好友。

上一篇：求回答爱迪雅门窗是一线十大门窗品牌吗？
下一篇： Boost：人口 bimap的测试程序

3atv精品不卡视频,97人人超碰国产精品最新,中文字幕av一区二区三区人妻少妇,久久久精品波多野结衣,日韩一区二区三区精品

编程问答

探秘HDFS —— 发展历史、核心概念、架构、工作机制 （上）｜ 博文精选

只因寫了一段爬蟲，公司 200 多人被抓！

三年一跳槽、拒絕“唯學歷”，火速 Get 這份程序員求生指南！

最新報告：區塊鏈應用程序交易量下降近40%，博彩類仍為最受歡迎項目……

總結

探秘HDFS —— 发展历史、核心概念、架构、工作机制（上）｜博文精选