Hadoop常见问题 | Hadoop能干什么?
戳藍字“CSDN云計算”關注我們哦!
我們很榮幸能夠見證Hadoop十幾年間經歷了從無到有,再到稱王。感動于技術的日新月異時,希望通過本篇有問有答,帶大家解決Hadoop的常見問題。
1
Q:?Hadoop 的發展歷史
A:
Q:Hadoop有哪些優點呢?
A:Hadoop 是一個能夠讓用戶輕松架構和使用的分布式計算的平臺。用戶可以輕松地在 Hadoop 發和運行處理海量數據的應用程序。其優點主要有以下幾個:
(1) 高可靠性?:Hadoop 按位存儲和處理數據的能力值得人們信賴。
(2) 高擴展性?:Hadoop 是在可用的計算機集簇間分配數據并完成計算任務的,這些集簇可以方便地擴展到數以干計的節點中。
(3) 高效性?:Hadoop能夠在節點之間動態地移動數據,并保證各個節點的動態平衡,因此處理速度非常快。
(4) 高容錯性?:Hadoop能夠自動保存數據的多個副本,并且能夠自動將失敗的任務重新分。
(5) 低成本?:與一體機、商用數據倉庫以及 QlikView、 Yonghong Z- Suites 等數據集市相比,Hadoop 是開源的,項目的軟件成本因此會大大降低。
Hadoop 帶有用 Java 語言編寫的框架,因此運行在 linux 生產平臺上是非常理想的, Hadoop 上的應用程序也可以使用其他語言編寫,比如 C++。
Q:25%的Spark正在脫離Hadoop生態單獨運行
A:Gartner報告其實是該系列調查的導火索。在早前的報告中,Gartner曾指出,盡管企業對大數據解決方案的需求不斷增長,但對Hadoop的需求沒有像預期那樣加速。同時,25%的Spark已經開始脫離Hadoop生態單獨運行。
Q:Hadoop能干什么?
A:大數據存儲:分布式存儲
日志處理:擅長日志分析
ETL:數據抽取到oracle、mysql、DB2、mongdb及主流數據庫
機器學習: 比如Apache Mahout項目
搜索引擎:Hadoop + lucene實現
數據挖掘:目前比較流行的廣告推薦,個性化廣告推薦
Hadoop是專為離線和大規模數據分析而設計的,并不適合那種對幾個記錄隨機讀寫的在線事務處理模式。
Q:Hadoop的特點
A:擴容能力(Scalable)?
能可靠地(reliably)存儲和處理千兆字節(PB)數據
成本低(Economical)?
可以通過普通機器組成的服務器集群來分發以及處理數據。這些服務器幾圈總計可以達到千個節點。
高效率(Efficient)?
通過分發數據,hadoop 可以在數據所在的節點上并行的(parallel)處理它們,這使得處理非常快。
可靠性(Reliable)?
hadoop 能自動地維護數據的多份副本,并且在任務失敗后能自動重新部署(redeploy)計算任務
小伙伴們沖鴨,后臺留言區等著你!
關于Hadoop,今天你學到了什么?還有哪些不懂的?除此還對哪些話題感興趣?快來留言區打卡啦!留言方式:打開第XX天,答:……
同時歡迎大家搜集更多問題,投稿給我們!風里雨里留言區里等你~
福利
掃描添加小編微信,備注“姓名+公司職位”,加入【云計算學習交流群】,和志同道合的朋友們共同打卡學習!
推薦閱讀:
微博宕機復盤:什么樣的技術架構,可支持80個明星并發出軌?
漫畫 | Kubernetes帶你一帆風順去遠航
Android 告急!
超酷炫!Facebook用深度學習和弱監督學習繪制全球精準道路圖
多地GitHub賬號使用受限;Python之父考慮重構解釋器;62歲程序員埋邏輯炸彈 | 開發者周刊
3個核心差異, 告訴你為什么Libra永遠成不了比特幣!
總結
以上是生活随笔為你收集整理的Hadoop常见问题 | Hadoop能干什么?的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 坦克炮的最远射程有多远?
- 下一篇: 公司转型微服务,真的有必要吗?