當前位置：首頁 > 编程资源 > 编程问答 >内容正文

编程问答

Hadoop之Yarn工作机制详解

發布時間：2024/2/28 编程问答 27 豆豆

生活随笔收集整理的這篇文章主要介紹了 Hadoop之Yarn工作机制详解小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

Hadoop之Yarn工作機制詳解

作業提交
第1步：client調用job.waitForCompletion方法，向整個集群提交MapReduce作業。
第2步：client向RM申請一個作業id。
第3步：RM給client返回該job資源的提交路徑和作業id。
第4步：client提交jar包、切片信息和配置文件到指定的資源提交路徑。
第5步：client提交完資源后，向RM申請運行MrAppMaster。

作業初始化
第6步：當RM收到client的請求后，將該job添加到容量調度器中。
第7步：某一個空閑的NM領取到該job。
第8步：該NM創建Container，并產生MRAppmaster。
第9步：下載client提交的資源到本地。

任務分配
第10步：MrAppMaster向RM申請運行多個maptask任務資源。
第11步：RM將運行maptask任務分配給另外兩個NodeManager，另兩個NodeManager分別領取任務并創建容器。

任務運行
第12步：MR向兩個接收到任務的NodeManager發送程序啟動腳本，這兩個NodeManager分別啟動maptask，maptask對數據分區排序。
第13步：MrAppMaster等待所有maptask運行完畢后，向RM申請容器，運行reduce task。
第14步：reduce task向maptask獲取相應分區的數據。
第15步：程序運行完畢后，MR會向RM申請注銷自己。

進度和狀態更新
YARN中的任務將其進度和狀態(包括counter)返回給應用管理器, 客戶端每秒(通過mapreduce.client.progressmonitor.pollinterval設置)向應用管理器請求進度更新, 展示給用戶。

作業完成
除了向應用管理器請求作業進度外, 客戶端每5分鐘都會通過調用waitForCompletion()來檢查作業是否完成。時間間隔可以通過mapreduce.client.completion.pollinterval來設置。作業完成之后, 應用管理器和container會清理工作狀態。作業的信息會被作業歷史服務器存儲以備之后用戶核查。

總結

以上是生活随笔為你收集整理的Hadoop之Yarn工作机制详解的全部內容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯，歡迎將生活随笔推薦給好友。

上一篇： Hadoop之Hadoop数据压缩
下一篇： Hadoop之资源调度器与任务推测执行

3atv精品不卡视频,97人人超碰国产精品最新,中文字幕av一区二区三区人妻少妇,久久久精品波多野结衣,日韩一区二区三区精品

生活随笔

生活随笔

编程问答

Hadoop之Yarn工作机制详解

Hadoop之Yarn工作機制詳解

目錄

1. Yarn概述

2. Yarn基本架構

3. Yarn工作機制

4. 作業提交全過程詳解

總結