當(dāng)前位置：首頁 > 编程资源 > 编程问答 >内容正文

编程问答

Hadoop之NameNode和SecondaryNameNode工作机制详解

發(fā)布時間：2024/2/28 编程问答 31 豆豆

生活随笔收集整理的這篇文章主要介紹了 Hadoop之NameNode和SecondaryNameNode工作机制详解小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

Hadoop之NameNode和SecondaryNameNode工作機(jī)制詳解

NN和2NN工作機(jī)制

NN和2NN工作機(jī)制詳解

Fsimage和Edits解析

checkpoint時間設(shè)置

1. NN和2NN工作機(jī)制

NN和2NN工作機(jī)制，如下圖

第一階段：NameNode啟動

第一次啟動NameNode格式化后，創(chuàng)建fsimage和edits文件。如果不是第一次啟動，直接加載編輯日志和鏡像文件到內(nèi)存。

客戶端對元數(shù)據(jù)進(jìn)行增刪改的請求。

NameNode記錄操作日志，更新滾動日志。

NameNode在內(nèi)存中對數(shù)據(jù)進(jìn)行增刪改查。

第二階段：Secondary NameNode工作

Secondary NameNode詢問NameNode是否需要checkpoint。直接帶回NameNode是否檢查結(jié)果。

Secondary NameNode請求執(zhí)行checkpoint。

NameNode滾動正在寫的edits日志。

將滾動前的編輯日志和鏡像文件拷貝到Secondary NameNode。

Secondary NameNode加載編輯日志和鏡像文件到內(nèi)存，并合并。

生成新的鏡像文件fsimage.chkpoint。

拷貝fsimage.chkpoint到NameNode。

NameNode將fsimage.chkpoint重新命名成fsimage。

2. NN和2NN工作機(jī)制詳解

Fsimage：namenode內(nèi)存中元數(shù)據(jù)序列化后形成的文件。

Edits：記錄客戶端更新元數(shù)據(jù)信息的每一步操作（可通過Edits運算出元數(shù)據(jù)）。

namenode啟動時，先滾動edits并生成一個空的edits.inprogress，然后加載edits和fsimage到內(nèi)存中，此時namenode內(nèi)存就持有最新的元數(shù)據(jù)信息。client開始對namenode發(fā)送元數(shù)據(jù)的增刪改查的請求，這些請求的操作首先會被記錄的edits.inprogress中（查詢元數(shù)據(jù)的操作不會被記錄在edits中，因為查詢操作不會更改元數(shù)據(jù)信息），如果此時namenode掛掉，重啟后會從edits中讀取元數(shù)據(jù)的信息。然后，namenode會在內(nèi)存中執(zhí)行元數(shù)據(jù)的增刪改查的操作。

由于edits中記錄的操作會越來越多，edits文件會越來越大，導(dǎo)致namenode在啟動加載edits時會很慢，所以需要對edits和fsimage進(jìn)行合并（所謂合并，就是將edits和fsimage加載到內(nèi)存中，照著edits中的操作一步步執(zhí)行，最終形成新的fsimage）。secondarynamenode的作用就是幫助namenode進(jìn)行edits和fsimage的合并工作。

secondarynamenode首先會詢問namenode是否需要checkpoint（觸發(fā)checkpoint需要滿足兩個條件中的任意一個，定時時間到和edits中數(shù)據(jù)寫滿了）。直接帶回namenode是否檢查結(jié)果。secondarynamenode執(zhí)行checkpoint操作，首先會讓namenode滾動edits并生成一個空的edits.inprogress，滾動edits的目的是給edits打個標(biāo)記，以后所有新的操作都寫入edits.inprogress，其他未合并的edits和fsimage會拷貝到secondarynamenode的本地，然后將拷貝的edits和fsimage加載到內(nèi)存中進(jìn)行合并，生成fsimage.chkpoint，然后將fsimage.chkpoint拷貝給namenode，重命名為fsimage后替換掉原來的fsimage。namenode在啟動時就只需要加載之前未合并的edits和fsimage即可，因為合并過的edits中的元數(shù)據(jù)信息已經(jīng)被記錄在fsimage中。

3. Fsimage和Edits解析

概念：namenode被格式化之后，將在/hadoop-2.7.2/data/tmp/dfs/name/current目錄中產(chǎn)生如下文件

fsimage_0000000000000000000fsimage_0000000000000000000.md5seen_txidVERSION

Fsimage文件：HDFS文件系統(tǒng)元數(shù)據(jù)的一個永久性的檢查點，其中包含HDFS文件系統(tǒng)的所有目錄和文件idnode的序列化信息。

Edits文件：存放HDFS文件系統(tǒng)的所有更新操作的路徑，文件系統(tǒng)客戶端執(zhí)行的所有寫操作首先會被記錄到edits文件中。

seen_txid文件保存的是一個數(shù)字，就是最后一個edits_的數(shù)字

每次NameNode啟動的時候都會將fsimage文件讀入內(nèi)存，并讀取edits里面的更新操作，保證內(nèi)存中的元數(shù)據(jù)信息是最新的、同步的，可以看成NameNode啟動的時候就將fsimage和edits文件進(jìn)行了合并。

4. checkpoint時間設(shè)置

通常情況下，SecondaryNameNode每隔一小時執(zhí)行一次。如果修改在hdfs-site中
[hdfs-default.xml]

<property><name>dfs.namenode.checkpoint.period</name><value>3600</value> </property >

（2）一分鐘檢查一次操作次數(shù)，當(dāng)操作次數(shù)達(dá)到1百萬時，SecondaryNameNode執(zhí)行一次。

<property><name>dfs.namenode.checkpoint.txns</name><value>1000000</value> <description>操作動作次數(shù)</description> </property><property><name>dfs.namenode.checkpoint.check.period</name><value>60</value> <description> 1分鐘檢查一次操作次數(shù)</description> </property >

總結(jié)

以上是生活随笔為你收集整理的Hadoop之NameNode和SecondaryNameNode工作机制详解的全部內(nèi)容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯，歡迎將生活随笔推薦給好友。

上一篇： Hadoop之HDFS读写数据流程
下一篇： Hadoop之DataNode工作机制