一、什么是hadoop?
生活随笔
收集整理的這篇文章主要介紹了
一、什么是hadoop?
小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.
一、什么是hadoop1. 背景Hadoop為分布式文件系統(tǒng)和計算的基礎(chǔ)框架系統(tǒng),其中包含hadoop程序,hdfs系統(tǒng)等。?2. 名詞解釋1.Hadoop, Apache開源的分布式框架。2.HDFS, hadoop的分布式文件系統(tǒng)3.NameNode, hadoop HDFS元數(shù)據(jù)主節(jié)點(diǎn)服務(wù)器,負(fù)責(zé)保存DataNode 文件存儲元數(shù)據(jù)信息。4.JobTracker, hadoop的Map/Reduce調(diào)度器,負(fù)責(zé)與TackTracker通信,分配計算任務(wù)并跟蹤任務(wù)進(jìn)度。5.DataNode, hadoop數(shù)據(jù)節(jié)點(diǎn),負(fù)責(zé)存儲數(shù)據(jù)。6.TaskTracker, hadoop調(diào)度程序,負(fù)責(zé)Map,Reduce 任務(wù)的具體啟動和執(zhí)行。7.Fuse, 多文件系統(tǒng)內(nèi)核程序,可將不同的文件系統(tǒng)mount成linux可讀寫模式3、hadoop能解決那些問題?---基礎(chǔ)與核心
來自為知筆記(Wiz)
- 海量數(shù)據(jù)需要及時分析和處理 --MapReduce
- 海量數(shù)據(jù)需要深入分析和挖掘--MapReduce
- 數(shù)據(jù)需要長期保存--HDFS
- 磁盤IO成為一種瓶頸,而非CPU資源
- 網(wǎng)絡(luò)帶寬是一種稀缺資源
- 硬件故障成為影響穩(wěn)定的一大因素
來自為知筆記(Wiz)
總結(jié)
以上是生活随笔為你收集整理的一、什么是hadoop?的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 计算机文化基础
- 下一篇: velocity 模板语言(VTL)