数据仓库--事实表
事實(shí)表分成三種:事務(wù)事實(shí)表、周期快照事實(shí)表、累計(jì)快照事實(shí)表
事務(wù)事實(shí)表
官方定義是:發(fā)生在某個(gè)時(shí)間點(diǎn)上的一個(gè)事件。比如以訂單為例:下單是一個(gè)事實(shí)、付款是一個(gè)事實(shí)、退款是一個(gè)事實(shí),所有事實(shí)的累計(jì)就是事務(wù)事實(shí)表
周期快照事實(shí)表
如果需要對(duì)某一天或者某個(gè)月的數(shù)據(jù)進(jìn)行分析,那么可以使用周期快照事實(shí)表,比如:以天舉例,財(cái)務(wù)報(bào)表一般都是周期快照事實(shí)表,它的最細(xì)粒度主鍵就是:日期+訂單
累計(jì)快照事實(shí)表
累計(jì)快照表,具有確定的開始和結(jié)束事件,并且記錄關(guān)鍵事件或者過(guò)程的里程碑,它因此包含了很多日期的外鍵
三種事實(shí)表的區(qū)別?
?
在維度建模的數(shù)據(jù)倉(cāng)庫(kù)中,事實(shí)表是指其中保存了大量業(yè)務(wù)度量數(shù)據(jù)的表。事實(shí)表中的度量值一般稱為事實(shí)。在事實(shí)表中最有用的事實(shí)就是數(shù)字類型的事實(shí)和可加類型的事實(shí)。事實(shí)表的粒度決定了數(shù)據(jù)倉(cāng)庫(kù)中數(shù)據(jù)的詳細(xì)程度。
一般來(lái)說(shuō),以粒度作為化分依據(jù),主要有三種事實(shí)表,分別是事務(wù)粒度事實(shí)表(Transaction Grain Fact Table),周期快照粒度事實(shí)表(Periodic Snapshot Grain Fact Table)和累積快照粒度事實(shí)表(Accumulating Snapshot Grain Fact Table)。
事務(wù)粒度事實(shí)表中的一條記錄代表了業(yè)務(wù)系統(tǒng)中的一個(gè)事件。事務(wù)出現(xiàn)以后,就會(huì)在事實(shí)中出現(xiàn)一條記錄。事務(wù)粒度事實(shí)表也稱為原子粒度。典型?的例子是銷售單分列項(xiàng)事實(shí)表。
周期快照粒度事實(shí)表用來(lái)記錄有規(guī)律的,可預(yù)見時(shí)間間隔的業(yè)務(wù)累計(jì)數(shù)據(jù)。通常的時(shí)間間隔可以是每天、每周或者每月。典型的例子是庫(kù)存日快照事實(shí)表。
累積快照事實(shí)表一般用來(lái)涵蓋一個(gè)事務(wù)的生命周期內(nèi)的不確定的時(shí)間跨度。典型的例子是KDT#2中描述的具有多個(gè)日期字段的發(fā)貨事實(shí)表。
?
通常來(lái)說(shuō),事務(wù)和快照是建模中的兩個(gè)非常重要的特點(diǎn),將兩者相結(jié)合可以使模型建立的更完整。
從用途的不同來(lái)說(shuō),事實(shí)表可以分為三類,分別是原子事實(shí)表,聚集事實(shí)表和合并事實(shí)表。
原子事實(shí)表(Atom Fact Table)是保存最細(xì)粒度數(shù)據(jù)的事實(shí)表,也是數(shù)據(jù)倉(cāng)庫(kù)中保存原子信息的場(chǎng)所。
聚集事實(shí)表(Aggregated Fact Table)是原子事實(shí)表上的匯總數(shù)據(jù),也稱為匯總事實(shí)表。即新建立一個(gè)事實(shí)表,它的維度表是比原維度表要少,或者某些維度表是原維度表的子集,如用月份維度表代替日期維度表;事實(shí)數(shù)據(jù)是相應(yīng)事實(shí)的匯總,即求和或求平均值等。在做數(shù)據(jù)遷移時(shí),當(dāng)相關(guān)的維度數(shù)據(jù)和事實(shí)數(shù)據(jù)發(fā)生變化時(shí),聚集事實(shí)表需要做相應(yīng)的刷新。物化視圖是實(shí)現(xiàn)聚集事實(shí)表的一種有效方式,可以設(shè)定刷新方式,具體功能由DBMS來(lái)實(shí)現(xiàn)。
合并事實(shí)表(Consolidated Fact Table)是指將位于不同事實(shí)表中處于相同粒度的事實(shí)進(jìn)行組合建模而成的一種事實(shí)表。即新建立一個(gè)事實(shí)表,它的維度是兩個(gè)或多個(gè)事實(shí)表的相同維度的集合;事實(shí)是幾個(gè)事實(shí)表中感興趣的事實(shí)。在Kimball的總線架構(gòu)中,由合并事實(shí)表為主組成的合并數(shù)據(jù)集市稱為二級(jí)數(shù)據(jù)集市。合并事實(shí)表的粒度可以是原子粒度也可以是聚集粒度。在做數(shù)據(jù)遷移時(shí),當(dāng)相關(guān)的原子事實(shí)表的數(shù)據(jù)有改變時(shí),合并事實(shí)表的數(shù)據(jù)需要重新刷新。合并事實(shí)表和交叉探察是兩個(gè)互補(bǔ)的操作。
聚集事實(shí)表和合并事實(shí)表的主要差別是合并事實(shí)表一般是從多個(gè)事實(shí)表合并而來(lái)。但是它們的差別不是絕對(duì)的,一個(gè)事實(shí)表既是聚集事實(shí)表又是合并事實(shí)表是很有可能的。因?yàn)橐话愫喜⑹聦?shí)表需要按相同的維度合并,所以很可能在做合并的同時(shí)需要進(jìn)行聚集,即粒度變粗。
轉(zhuǎn)載于:https://www.cnblogs.com/xyg-zyx/p/9803580.html
總結(jié)
- 上一篇: Collections接口下的Compa
- 下一篇: TODO: ping和telnet