hadoop--Yarn资源调度器的基础架构、工作机制 与 作业提交全过程
目錄
- 一、Yarn資源調(diào)度器
- Yarn 基礎(chǔ)架構(gòu)
- 二、YARN工作機(jī)制
- 三、作業(yè)提交全過程
- 1. HDFS、YARN、MapReduce三者關(guān)系
- 2. 作業(yè)提交過程(YARN)
- 3. 作業(yè)提交過程(HDFS & MapReduce)
一、Yarn資源調(diào)度器
??:YARN是一個(gè)資源調(diào)度平臺(tái),負(fù)責(zé)為運(yùn)算程序提供服務(wù)器運(yùn)算資源,相當(dāng)于一個(gè)分布式的操作系統(tǒng)平臺(tái),而MapReduce等運(yùn)算程序則相當(dāng)于操作系統(tǒng)上的應(yīng)用程序。
作用:
YARN負(fù)責(zé)管理集群資源;
負(fù)責(zé)給任務(wù)合理分配資源。
Yarn 基礎(chǔ)架構(gòu)
YARN主要由ResourceManager、NodeManager、ApplicationMaster和Container等組件構(gòu)成。
二、YARN工作機(jī)制
三、作業(yè)提交全過程
1. HDFS、YARN、MapReduce三者關(guān)系
2. 作業(yè)提交過程(YARN)
3. 作業(yè)提交過程(HDFS & MapReduce)
HDFS的讀寫數(shù)據(jù)流程==>
作業(yè)提交全過程:
- 一、作業(yè)提交
- 二、作業(yè)初始化
- 三、任務(wù)分配
- 四、任務(wù)運(yùn)行
- 五、進(jìn)度和狀態(tài)更新
YARN中的任務(wù)將其進(jìn)度和狀態(tài)(包括counter)返回給應(yīng)用管理器,客戶端每秒(通過 mapreduce.client.progressmonitor.pollinterval 設(shè)置)向應(yīng)用管理器請求進(jìn)度更新,展示給用戶。
- 六、作業(yè)完成?
除了向應(yīng)用管理器請求作業(yè)進(jìn)度外,客戶端每5秒都會(huì)通過調(diào)用waitForCompletion()方法來檢查作業(yè)是否完成。時(shí)間間隔可以通過mapreduce.client.completion.pollinterval 來設(shè)置。作業(yè)完成之后,應(yīng)用管理器和Container會(huì)清理工作狀態(tài),作業(yè)的信息會(huì)被歷史服務(wù)器存儲(chǔ)以備后續(xù)用戶核查。
總結(jié)
以上是生活随笔為你收集整理的hadoop--Yarn资源调度器的基础架构、工作机制 与 作业提交全过程的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 【译】Activitys, Thread
- 下一篇: 如何用 ajax 连接mysql数据库,