HBase数据模型:rowkey timestamp 列族 cell
生活随笔
收集整理的這篇文章主要介紹了
HBase数据模型:rowkey timestamp 列族 cell
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
-
rowkey:唯一標識一行記錄
-
timestamp:時間戳,版本的概念,必須要給出時間戳,默認當前系統時間
-
列族:一組列的集合
-
HBase能存儲10億級別的行和百萬級別的列
-
列族是最小的控制單元,不能控制列,所有列都具備相同的公共屬性,沒法改變某個列的屬性
-
cell中可以存儲多條記錄,根據版本號來區分,是追加不是覆蓋
-
默認只保留一個版本
-
刪除數據并非立即刪除,只是給個失效標記,在文件合并的時候刪除
-
rowkey + cf + colume + timestamp 四項結合才能唯一確定cell數據
-
列族理論上有無限個列,沒有限制 列可以動態加入
-
調優、權限控制都是針對cf列族
-
hbase會將同一列族中的數據保存在同一目錄下
-
一個表對應hdfs上的一個目錄
-
每個cf對應一個文件,多個列族對應多個文件
總結
以上是生活随笔為你收集整理的HBase数据模型:rowkey timestamp 列族 cell的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: idea设置java scala等代码自
- 下一篇: HBase原理