高可用性的HDFS—Hadoop分布式文件系统深度实践
生活随笔
收集整理的這篇文章主要介紹了
高可用性的HDFS—Hadoop分布式文件系统深度实践
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
《高可用性的HDFS—Hadoop分布式文件系統深度實踐》
基本信息
作者: 文艾 王磊
出版社:清華大學出版社
ISBN:9787302282587
上架時間:2012-5-14
出版日期:2012 年5月
開本:16開
頁碼:371
版次:1-1
所屬分類: 計算機 > 軟件與程序設計 > 分布式系統設計
更多詳情 》》》高可用性的HDFS—Hadoop分布式文件系統深度實踐
內容簡介
計算機書籍
《高可用性的hdfs—hadoop分布式文件系統深度實踐》專注于hadoop分布式文件系統(hdfs)的主流ha解決方案,內容包括:hdfs元 數據解析、hadoop元數據備份方案、hadoop backup node方案、avatarnode解決方案以及最新的ha解決方案cloudrea ha name node等。其中有關backup node方案及avatarnode方案的內容是本書重點,尤其是對avatarnode方案從運行機制到異常處理方案的步驟進行了詳盡介紹,同時還總結 了各種異常情況下avatarnode的各種處理方案。
《高可用性的hdfs—hadoop分布式文件系統深度實踐》從代碼入手并結合情景分析、案例解說對hdfs的元數據以及主流的hdfs ha解決方案的運行機制進行了深入剖析,力求使讀者在解決問題時做到心中有數,不僅知其然還知其所以然。
本書光盤包含本書部分操作的視頻教程以及所有源代碼、腳本等開發文件。
《高可用性的hdfs—hadoop分布式文件系統深度實踐》讀者主要為云計算相關領域的研發人員、云計算系統管理維護人員,也適合作為高校研究生和高年級本科生的專業課輔助教材。
目錄
《高可用性的hdfs—hadoop分布式文件系統深度實踐》
第1章 hdfs ha及解決方案 1
1.1 hdfs系統架構 2
1.2 ha定義 3
1.3 hdfs ha原因分析及應對措施 4
1.3.1 可靠性 4
1.3.2 可維護性 5
1.4 現有hdfs ha解決方案 5
1.4.1 hadoop的元數據備份方案 6
1.4.2 hadoop的secondarynamenode方案 7
1.4.3 hadoop的checkpoint ode方案 7
1.4.4 hadoop的backupnode方案 8
1.4.5 drdb方案 9
1.4.6 facebook的avatarnode方案 10
1.5 方案優缺點比較 10
第2章 hdfs元數據解析 13
2.1 概述 14
2.2 內存元數據結構 14
2.2.1 inode 15
2.2.2 block 16
.2.2.3 blockinfo和datanodedescriptor 17
2.2.4 小結 17
2.2.5 代碼分析——元數據結構 18
2.3 磁盤元數據文件 24
2.4 format情景分析 27
2.5 元數據應用場景分析 45
第3章 hadoop的元數據備份方案 47
3.1 運行機制分析 48
3.1.1 namenode啟動加載元數據情景分析 50
3.1.2 元數據更新及日志寫入情景分析 64
3.1.3 checkpoint過程情景分析 73
3.1.4 元數據可靠性機制 109
3.1.5 元數據一致性機制 110
3.2 使用說明 110
第4章 hadoop的backup node方案 113
4.1 backup node概述 114
4.1.1 系統架構 115
4.1.2 使用原則 115
4.1.3 優缺點 116
4.2 運行機制分析 116
4.2.1 啟動流程 117
4.2.2 元數據操作情景分析 141
4.2.3 日志池(journal spool)機制 151
4.2.4 故障切換機制 156
4.3 實驗方案說明 158
4.4 構建實驗環境 158
4.4.1 網絡拓撲 159
4.4.2 系統安裝及配置 160
4.4.3 安裝jdk 170
4.4.4 虛擬機集群架設 171
4.4.5 namenode安裝及配置 173
4.4.6 backup node安裝及配置 173
4.4.7 data node安裝及配置 174
4.4.8 clients安裝及配置 175
4.5 異常解決方案 175
4.5.1 異常情況分析 175
4.5.2 namenode配置 175
4.5.3 backup node配置 182
4.5.4 data node配置 185
4.5.5 namenode宕機切換實驗 189
4.5.6 namenode宕機讀寫測試 196
第5章 avatarnode運行機制 205
5.1 方案說明 206
5.1.1 系統架構 206
5.1.2 思路分析 208
5.1.3 性能數據 209
5.2 元數據分析 209
5.2.1 類fsnamesystem 210
5.2.2 類fsdirectory 210
5.2.3 avatarnode的磁盤元數據文件 211
5.3 avatarnode primary啟動過程 211
5.4 avatarnode standby啟動過程 217
5.4.1 avatarnode的構造方法 217
5.4.2 standby線程的run()方法 218
5.4.3 ingest線程的run()方法 220
5.4.4 ingest線程的ingestfsedits ()方法 220
5.4.5 standby線程的docheckpoint()方法 221
5.5 用戶操作情景分析 223
5.5.1 創建目錄情景分析 223
5.5.2 創建文件情景分析 231
5.6 avatarnode standby故障切換過程 240
5.7 元數據一致性保證機制 242
5.7.1 元數據目錄樹信息 242
5.7.2 data node與block數據塊映射信息 243
5.8 block更新同步問題 246
5.8.1 問題描述 246
5.8.2 結論 246
5.8.3 源碼分析 246
第6章 avatarnode使用 253
6.1 方案說明 254
6.1.1 網絡拓撲 254
6.1.2 操作系統安裝及配置 255
6.2 使用avatar打補丁版本 255
6.2.1 hadoop源碼聯機build 256
6.2.2 hadoop源碼本地build 262
6.2.3 nfs服務器構建 264
6.2.4 avatar分發與部署 267
6.2.5 primary(namenode0)節點配置 269
6.2.7 data node節點配置 276
6.2.8 client節點配置 278
6.2.9 創建目錄 279
6.2.10 掛載nfs 280
6.2.11 啟動ucarp 280
6.2.12 格式化 281
6.2.13 系統啟動 281
6.2.14 檢查 282
6.2.15 namenode失效切換寫文件實驗 283
6.2.16 namenode失效切換讀文件實驗 291
6.3 avatar facebook版本的使用 294
6.3.1 hadoop facebook版本安裝 294
6.3.2 節點配置 295
6.3.3 啟動hdfs 300
6.3.4 namenode失效切換 302
第7章 avatarnode異常解決方案 305
7.1 測試環境 306
7.2 primary失效 306
7.2.1 解決方案 306
7.2.2 寫操作實驗步驟 307
7.2.3 改進寫操作機制 313
7.2.4 讀操作實驗步驟 313
7.2.5 小結 317
7.3 standby失效 317
7.4 nfs失效(數據未損壞) 317
7.4.1 解決方案 317
7.4.2 寫操作實驗步驟 318
7.4.3 讀操作實驗步驟 320
7.4.4 小結 322
7.5 nfs失效(數據已損壞) 323
7.5.1 解決方案 323
7.5.2 寫操作實驗步驟 324
7.5.3 讀操作實驗步驟 327
7.5.4 小結 330
7.6 primary先失效,nfs后失效(數據未損壞) 331
7.6.1 解決方案 331
7.6.2 寫操作實驗步驟 331
7.6.3 讀操作實驗步驟 333
7.6.4 小結 334
7.7 primary先失效(數據未損壞),nfs后失效(數據損壞) 335
7.7.1 解決方案 335
7.7.2 寫操作實驗步驟 335
7.7.3 讀操作實驗步驟 338
7.7.4 小結 339
7.8 nfs先失效(數據未損壞),primary后失效 340
7.8.1 解決方案 340
7.8.2 寫操作實驗步驟 340
7.8.3 讀操作實驗步驟 342
7.8.4 小結 343
7.9 nfs先失效(數據損壞),primary后失效(數據損壞) 344
7.9.1 解決方案 344
7.9.2 寫操作實驗步驟 344
7.9.3 讀操作實驗步驟 346
7.9.4 小結 348
7.10 實驗結論 348
第8章 cloudera ha namenode使用 349
8.1 ha namenode說明 350
8.2 cdh4b1版本hdfs集群配置 351
8.2.1 虛擬機安裝 351
8.2.2 nn1配置 351
8.2.3 dn1~dn3配置 355
8.2.4 hdfs集群構建 358
8.3 ha namenode配置 361
8.3.1 nn1配置 361
8.3.2 其他節點配置 365
8.4 ha namenode使用 367
8.4.1 啟動ha hdfs集群 367
8.4.2 第1次failover 368
8.4.3 模擬寫操作 368
8.4.4 模擬active name node失效,第2次failover 369
8.3.5 模擬新的standby namenode加入 370
8.5 小結 371
本圖書來源:中國互動出版網
基本信息
作者: 文艾 王磊
出版社:清華大學出版社
ISBN:9787302282587
上架時間:2012-5-14
出版日期:2012 年5月
開本:16開
頁碼:371
版次:1-1
所屬分類: 計算機 > 軟件與程序設計 > 分布式系統設計
| ? |
更多詳情 》》》高可用性的HDFS—Hadoop分布式文件系統深度實踐
內容簡介
計算機書籍
《高可用性的hdfs—hadoop分布式文件系統深度實踐》專注于hadoop分布式文件系統(hdfs)的主流ha解決方案,內容包括:hdfs元 數據解析、hadoop元數據備份方案、hadoop backup node方案、avatarnode解決方案以及最新的ha解決方案cloudrea ha name node等。其中有關backup node方案及avatarnode方案的內容是本書重點,尤其是對avatarnode方案從運行機制到異常處理方案的步驟進行了詳盡介紹,同時還總結 了各種異常情況下avatarnode的各種處理方案。
《高可用性的hdfs—hadoop分布式文件系統深度實踐》從代碼入手并結合情景分析、案例解說對hdfs的元數據以及主流的hdfs ha解決方案的運行機制進行了深入剖析,力求使讀者在解決問題時做到心中有數,不僅知其然還知其所以然。
本書光盤包含本書部分操作的視頻教程以及所有源代碼、腳本等開發文件。
《高可用性的hdfs—hadoop分布式文件系統深度實踐》讀者主要為云計算相關領域的研發人員、云計算系統管理維護人員,也適合作為高校研究生和高年級本科生的專業課輔助教材。
目錄
《高可用性的hdfs—hadoop分布式文件系統深度實踐》
第1章 hdfs ha及解決方案 1
1.1 hdfs系統架構 2
1.2 ha定義 3
1.3 hdfs ha原因分析及應對措施 4
1.3.1 可靠性 4
1.3.2 可維護性 5
1.4 現有hdfs ha解決方案 5
1.4.1 hadoop的元數據備份方案 6
1.4.2 hadoop的secondarynamenode方案 7
1.4.3 hadoop的checkpoint ode方案 7
1.4.4 hadoop的backupnode方案 8
1.4.5 drdb方案 9
1.4.6 facebook的avatarnode方案 10
1.5 方案優缺點比較 10
第2章 hdfs元數據解析 13
2.1 概述 14
2.2 內存元數據結構 14
2.2.1 inode 15
2.2.2 block 16
.2.2.3 blockinfo和datanodedescriptor 17
2.2.4 小結 17
2.2.5 代碼分析——元數據結構 18
2.3 磁盤元數據文件 24
2.4 format情景分析 27
2.5 元數據應用場景分析 45
第3章 hadoop的元數據備份方案 47
3.1 運行機制分析 48
3.1.1 namenode啟動加載元數據情景分析 50
3.1.2 元數據更新及日志寫入情景分析 64
3.1.3 checkpoint過程情景分析 73
3.1.4 元數據可靠性機制 109
3.1.5 元數據一致性機制 110
3.2 使用說明 110
第4章 hadoop的backup node方案 113
4.1 backup node概述 114
4.1.1 系統架構 115
4.1.2 使用原則 115
4.1.3 優缺點 116
4.2 運行機制分析 116
4.2.1 啟動流程 117
4.2.2 元數據操作情景分析 141
4.2.3 日志池(journal spool)機制 151
4.2.4 故障切換機制 156
4.3 實驗方案說明 158
4.4 構建實驗環境 158
4.4.1 網絡拓撲 159
4.4.2 系統安裝及配置 160
4.4.3 安裝jdk 170
4.4.4 虛擬機集群架設 171
4.4.5 namenode安裝及配置 173
4.4.6 backup node安裝及配置 173
4.4.7 data node安裝及配置 174
4.4.8 clients安裝及配置 175
4.5 異常解決方案 175
4.5.1 異常情況分析 175
4.5.2 namenode配置 175
4.5.3 backup node配置 182
4.5.4 data node配置 185
4.5.5 namenode宕機切換實驗 189
4.5.6 namenode宕機讀寫測試 196
第5章 avatarnode運行機制 205
5.1 方案說明 206
5.1.1 系統架構 206
5.1.2 思路分析 208
5.1.3 性能數據 209
5.2 元數據分析 209
5.2.1 類fsnamesystem 210
5.2.2 類fsdirectory 210
5.2.3 avatarnode的磁盤元數據文件 211
5.3 avatarnode primary啟動過程 211
5.4 avatarnode standby啟動過程 217
5.4.1 avatarnode的構造方法 217
5.4.2 standby線程的run()方法 218
5.4.3 ingest線程的run()方法 220
5.4.4 ingest線程的ingestfsedits ()方法 220
5.4.5 standby線程的docheckpoint()方法 221
5.5 用戶操作情景分析 223
5.5.1 創建目錄情景分析 223
5.5.2 創建文件情景分析 231
5.6 avatarnode standby故障切換過程 240
5.7 元數據一致性保證機制 242
5.7.1 元數據目錄樹信息 242
5.7.2 data node與block數據塊映射信息 243
5.8 block更新同步問題 246
5.8.1 問題描述 246
5.8.2 結論 246
5.8.3 源碼分析 246
第6章 avatarnode使用 253
6.1 方案說明 254
6.1.1 網絡拓撲 254
6.1.2 操作系統安裝及配置 255
6.2 使用avatar打補丁版本 255
6.2.1 hadoop源碼聯機build 256
6.2.2 hadoop源碼本地build 262
6.2.3 nfs服務器構建 264
6.2.4 avatar分發與部署 267
6.2.5 primary(namenode0)節點配置 269
6.2.7 data node節點配置 276
6.2.8 client節點配置 278
6.2.9 創建目錄 279
6.2.10 掛載nfs 280
6.2.11 啟動ucarp 280
6.2.12 格式化 281
6.2.13 系統啟動 281
6.2.14 檢查 282
6.2.15 namenode失效切換寫文件實驗 283
6.2.16 namenode失效切換讀文件實驗 291
6.3 avatar facebook版本的使用 294
6.3.1 hadoop facebook版本安裝 294
6.3.2 節點配置 295
6.3.3 啟動hdfs 300
6.3.4 namenode失效切換 302
第7章 avatarnode異常解決方案 305
7.1 測試環境 306
7.2 primary失效 306
7.2.1 解決方案 306
7.2.2 寫操作實驗步驟 307
7.2.3 改進寫操作機制 313
7.2.4 讀操作實驗步驟 313
7.2.5 小結 317
7.3 standby失效 317
7.4 nfs失效(數據未損壞) 317
7.4.1 解決方案 317
7.4.2 寫操作實驗步驟 318
7.4.3 讀操作實驗步驟 320
7.4.4 小結 322
7.5 nfs失效(數據已損壞) 323
7.5.1 解決方案 323
7.5.2 寫操作實驗步驟 324
7.5.3 讀操作實驗步驟 327
7.5.4 小結 330
7.6 primary先失效,nfs后失效(數據未損壞) 331
7.6.1 解決方案 331
7.6.2 寫操作實驗步驟 331
7.6.3 讀操作實驗步驟 333
7.6.4 小結 334
7.7 primary先失效(數據未損壞),nfs后失效(數據損壞) 335
7.7.1 解決方案 335
7.7.2 寫操作實驗步驟 335
7.7.3 讀操作實驗步驟 338
7.7.4 小結 339
7.8 nfs先失效(數據未損壞),primary后失效 340
7.8.1 解決方案 340
7.8.2 寫操作實驗步驟 340
7.8.3 讀操作實驗步驟 342
7.8.4 小結 343
7.9 nfs先失效(數據損壞),primary后失效(數據損壞) 344
7.9.1 解決方案 344
7.9.2 寫操作實驗步驟 344
7.9.3 讀操作實驗步驟 346
7.9.4 小結 348
7.10 實驗結論 348
第8章 cloudera ha namenode使用 349
8.1 ha namenode說明 350
8.2 cdh4b1版本hdfs集群配置 351
8.2.1 虛擬機安裝 351
8.2.2 nn1配置 351
8.2.3 dn1~dn3配置 355
8.2.4 hdfs集群構建 358
8.3 ha namenode配置 361
8.3.1 nn1配置 361
8.3.2 其他節點配置 365
8.4 ha namenode使用 367
8.4.1 啟動ha hdfs集群 367
8.4.2 第1次failover 368
8.4.3 模擬寫操作 368
8.4.4 模擬active name node失效,第2次failover 369
8.3.5 模擬新的standby namenode加入 370
8.5 小結 371
本圖書來源:中國互動出版網
轉載于:https://www.cnblogs.com/china-pub/archive/2012/05/21/2511779.html
總結
以上是生活随笔為你收集整理的高可用性的HDFS—Hadoop分布式文件系统深度实践的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 简明python教程电子书下载_简明Py
- 下一篇: [leetcode](4.21)4. 有