Hadoop之DataNode工作机制
生活随笔
收集整理的這篇文章主要介紹了
Hadoop之DataNode工作机制
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
Hadoop之DataNode工作機制
目錄
1. DataNode工作機制
DataNode工作機制如下圖
一個數據塊在DataNode上以文件形式存儲在磁盤上,包括兩個文件,一個是數據本身,一個是元數據包括數據塊的長度,塊數據的校驗和,以及時間戳。
DataNode啟動后向NameNode注冊,通過后,周期性(1小時)的向NameNode上報所有的塊信息。
心跳是每3秒一次,心跳返回結果帶有NameNode給該DataNode的命令如復制塊數據到另一臺機器,或刪除某個數據塊。如果超過10分鐘沒有收到某個DataNode的心跳,則認為該節點不可用。
集群運行中可以安全加入和退出一些機器。
2. 數據完整性
當DataNode讀取block的時候,它會計算checksum。
如果計算后的checksum,與block創建時值不一樣,說明block已經損壞。
client讀取其他DataNode上的block。
datanode在其文件創建后周期驗證checksum,如下圖所示。
3. 掉線時限參數設置
總結
以上是生活随笔為你收集整理的Hadoop之DataNode工作机制的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Hadoop之NameNode和Seco
- 下一篇: Hadoop之MapReduce入门