初识Hadoop(核心组件与应用)
生活随笔
收集整理的這篇文章主要介紹了
初识Hadoop(核心组件与应用)
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
1、核心組件
核心組件包括Hadoop的基礎組件HDFS、MapReduce和Yarn,以及其他常用組件如:HBase、Hive、Hadoop Streaming、Zookeeper等。
?2、組件介紹:
?HDFS:分布式海量數據存儲功能
?Yarn:提供資源調度與任務管理功能
?資源調度:根據申請的計算任務,合理分配集群中的計算節點(計算機)。
?任務管理:任務在執行過程中,負責過程監控、狀態反饋、任務再調度等工作。
?MapReduce:分布式并行編程模型和計算框架。解決分布式編程門檻高的問題,基于其框架對分布式計算的抽象map和reduce,可以輕松實現分布式計算程序。
?Hive:提供數據摘要和查詢的數據倉庫。解決數據倉庫構建問題,基于Hadoop平臺的存儲與計算,與傳統SQL相結合,讓熟悉SQL的編程人員輕松向Hadoop平臺遷移。
?Streaming:解決非Java開發人員使用Hadoop平臺的語言問題,使各種語言如C++、python、shell等均可以無障礙使用Hadoop平臺。
?HBase:基于列式存儲模型的分布式數據庫。解決某些場景下,需要Hadoop平臺數據及時響應的問題。
?Zookeeper:分布式協同服務。主要解決分布式下數據管理問題:統一命名、狀態同步、集群管理、配置同步等。
3、Hadoop生態圈
?
總結
以上是生活随笔為你收集整理的初识Hadoop(核心组件与应用)的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 什么样学生适合学计算机动漫,动画专业的学
- 下一篇: 网络营销应该怎样做?巧用换IP软件