生态篇-HBase 生态介绍
HBase 生態介紹
我們都知道,HBase是受Google公布的BigTable論文而產生的一種分布式、多版本、面向列的開源 KV 數據庫。HBase稀疏矩陣的設計使得其特別適合存儲非結構化的數據,比如用戶畫像、日志以及消息等數據。但是隨著業務的快速發展,我們面臨著各種新挑戰和新需求,數據格式也隨著業務的發展變得多種多樣,其中包括:KV 數據、關系數據、文檔數據、圖數據以及時空時序等數據。而且隨著時間的推移,各種數據占比越來越大,如下圖所示:
從上圖可以看出,從2013年開始,關系型數據的總體占比在逐年下降;而圖數據、搜索數據、KV 數據、文檔數據以及時序數據等卻在逐年上升。到2018年, 關系型數據的占比已經由2013年的90%多下降到 2018年的75.4%。
面對如此多樣的數據,我們急需一種系統,能夠存儲這些逐年增長的數據。所以 很有必要在 HBase 之上引入各種組件,使得 HBase 能夠支持 SQL、時序、時空、 圖、全文檢索能力、及復雜分析。所以,完整的 HBase 生態如下:
從最底下開始看,這里面可以根據不同的需求選擇不同的存儲介質。比如熱數據我們可以存儲在SSD中;溫數據存儲在HDD中,冷數據存儲在 OSS中。中間一層就是HBase以及Solr。最上層是解決各種場景的組件。下面簡單介紹下每種組件的作用。
通過在 HBase之上引入了各種組件之后,使得HBase應用場景得到了極大的擴展,滿足了監控、車聯網、風控、實時推薦、政企、人工智能等場景的需求。
目前阿里云提供了HBase及X-Pack組件,其X-Pack組件形式和上面的 HBase生態很類似;除此之外,X-Pack 組件還針對HBase做了大量的優化,滿足豐富業務處理需求、同時更加易用、更加強大功能。
總結
以上是生活随笔為你收集整理的生态篇-HBase 生态介绍的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 使用Xshell连接Linux服务器
- 下一篇: crontab添加定时任务