【商务智能】数据仓库 ( 多维数据模型 | 多维数据分析 )
商務(wù)智能系列文章目錄
【商務(wù)智能】數(shù)據(jù)預(yù)處理
【商務(wù)智能】數(shù)據(jù)倉(cāng)庫(kù) ( 多維數(shù)據(jù)模型 | 多維數(shù)據(jù)分析 )
文章目錄
- 商務(wù)智能系列文章目錄
- 前言
- 一、數(shù)據(jù)倉(cāng)庫(kù) 與 傳統(tǒng)數(shù)據(jù)庫(kù) 區(qū)別
- 二、數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)體系結(jié)構(gòu)
- 三、多維數(shù)據(jù)模型
- 1、星型模式
- 2、雪片模式
- 3、事實(shí)星座
- 四、在線分析處理
- 五、多維數(shù)據(jù)分析操作
- 總結(jié)
前言
上一篇博客 【商務(wù)智能】數(shù)據(jù)預(yù)處理 中講解了數(shù)據(jù)預(yù)處理操作 , 本篇博客介紹 數(shù)據(jù)倉(cāng)庫(kù) , 數(shù)據(jù)倉(cāng)庫(kù)與傳統(tǒng)數(shù)據(jù)庫(kù)區(qū)別 , 多維數(shù)據(jù)模型 等 ;
一、數(shù)據(jù)倉(cāng)庫(kù) 與 傳統(tǒng)數(shù)據(jù)庫(kù) 區(qū)別
數(shù)據(jù)倉(cāng)庫(kù)特征 :
- 面向主題
- 集成
- 不可更新
- 隨時(shí)間不斷變化
數(shù)據(jù)倉(cāng)庫(kù)定義 : 數(shù)據(jù)倉(cāng)庫(kù) 是 用于 更好地 支持 企業(yè) / 組織 決策分析處理 , 面向主題的 , 集成的 , 不可更新的 , 隨時(shí)間不斷變化的 數(shù)據(jù)集合 ;
傳統(tǒng)的數(shù)據(jù)庫(kù) 又稱為 操作型數(shù)據(jù)庫(kù) , 如 Oracle , MySQL 等數(shù)據(jù)庫(kù) ;
| 數(shù)據(jù)粒度 | 細(xì)節(jié)的 | 綜合的 |
| 數(shù)據(jù)時(shí)效 | 存儲(chǔ)瞬間準(zhǔn)確 | 過(guò)去的歷史數(shù)據(jù) |
| 是否只讀 | 可更新 | 不可更新 |
| 需求可知 | 操作時(shí)實(shí)現(xiàn)知道需求 | 操作時(shí)事先不知道需求 |
| 生命周期 | 生命周期符合 SDLC | 完全不同的生命周期 |
| 性能要求 | 性能要求高 | 性能要求低 |
| 操作大小 | 同一時(shí)刻操作一個(gè)單元的數(shù)據(jù) | 同一時(shí)刻操作一個(gè)集合的數(shù)據(jù) |
| 數(shù)據(jù)大小 | 單次操作數(shù)據(jù)量小 | 單次操作數(shù)據(jù)量大 |
| 驅(qū)動(dòng)力量 | 事務(wù)驅(qū)動(dòng) | 分析驅(qū)動(dòng) |
| 具體用途 | 面向應(yīng)用 | 面向分析 |
| 應(yīng)用場(chǎng)景 | 支持日常操作 | 支持管理需求 |
| 數(shù)據(jù)內(nèi)容 | 業(yè)務(wù)相關(guān)數(shù)據(jù) | 決策相關(guān)數(shù)據(jù) |
| 數(shù)據(jù)模型 | 關(guān)系,層次結(jié)構(gòu) | 關(guān)系, 多維數(shù)據(jù)結(jié)構(gòu) |
| 數(shù)據(jù)訪問(wèn) | 隨機(jī)讀寫(xiě)操作 | 只有查詢操作 |
| 工作負(fù)載 | 事物處理量大, 每個(gè)事物涉及記錄很少 | 查詢小, 每次需要查詢大量數(shù)據(jù) |
| 事務(wù)輸出 | 很少 | 很大 |
| 系統(tǒng)停機(jī) | 災(zāi)難性的系統(tǒng)宕機(jī) | 延遲決策 |
二、數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)體系結(jié)構(gòu)
數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)體系結(jié)構(gòu) :
- 數(shù)據(jù)源
- 集成工具
- 數(shù)據(jù)倉(cāng)庫(kù)
- 數(shù)據(jù)倉(cāng)庫(kù)服務(wù)器
- OLAP 服務(wù)器
- 元數(shù)據(jù)
- 元數(shù)據(jù)管理工具
- 數(shù)據(jù)集市
- 前臺(tái)分析工具
三、多維數(shù)據(jù)模型
多維數(shù)據(jù)模型 : 從 業(yè)務(wù)分析 角度 , 對(duì)數(shù)據(jù)進(jìn)行 邏輯建模 的方法 ; 具有 簡(jiǎn)單 , 易于理解 , 方便查詢 ;
多維數(shù)據(jù)模型 又稱為 維度數(shù)據(jù)模型 , 由 維度表 和 事實(shí)表 構(gòu)成 ;
1、星型模式
星型模式 : 中間有一個(gè)表 , 稱為 事實(shí)表 , 周?chē)泻芏嘈”?, 這些表稱為 維表 ;
星型模式 缺點(diǎn) :
① 星型模式 不支持 維 的層結(jié)構(gòu) ;
- 單一維表 : 每個(gè) 維 只有一個(gè)維表 , 所有的 維層屬性 都放在一個(gè)表中 , 沒(méi)有進(jìn)行規(guī)范化 ;
- 單一維表 示例 : 以上述 “商品” 事實(shí)表的 時(shí)間 對(duì)應(yīng)的維表 為例 , 將 年 , 月 , 日 , 時(shí) , 分 , 秒 等字段放在同一個(gè) 維表 中 , 時(shí)間維 可以變成 多個(gè)維表 , 如只包含 年月日的維表 , 只包含 年 月 的維表 等 ;
② 數(shù)據(jù)冗余 :
- 數(shù)據(jù)冗余 : 每個(gè) 維表 都要表示所有的層 , 每個(gè)層有自己的屬性 , 有很多數(shù)據(jù)冗余 ;
- 數(shù)據(jù)冗余 示例 : 上述 時(shí)間維表 中每個(gè)商品 , 都要存儲(chǔ)完整的 年 , 月 , 日 , 時(shí) , 分 , 秒 數(shù)據(jù) , 實(shí)際上商品的 年 , 月 , 等數(shù)據(jù) , 很多商品都是相同的 , 只記錄一次即可 , 不同所有的商品都記錄年月 信息 , 因此產(chǎn)生了大量的冗余數(shù)據(jù) ;
③ 不同維層屬性名相同查詢問(wèn)題 :
- 不同維層 , 有相同的屬性 , 只能使用 換名 方式進(jìn)行查詢 ;
- 不同維層 相同屬性示例 : 如 商店 事實(shí)表中 , 城市 , 省份 , 國(guó)家 , 每個(gè)層級(jí)都有一個(gè)經(jīng)理 Manager , 當(dāng) 查詢 Manager 屬性時(shí) , 直接將 城市經(jīng)理 , 省份經(jīng)理 , 國(guó)家經(jīng)理 , 都查詢出來(lái)了 , 無(wú)法查詢單獨(dú)一個(gè)級(jí)別的經(jīng)理信息 ;
2、雪片模式
對(duì)于 維層次 復(fù)雜的維
- 為了 避免 冗余數(shù)據(jù)占用過(guò)多空間
- 為了 支持 不同維層 相同屬性 查詢
使用多個(gè)維表 描述復(fù)雜的維 , 這樣在 星型模型 的 星的角上 , 出現(xiàn)了分支 , 類(lèi)似于雪花形狀 , 因此這種變種的 星型模型 稱為 “雪片模型” ;
雪片模型 優(yōu)缺點(diǎn) :
- 雪片模型優(yōu)點(diǎn) : 雪片模型的維表是規(guī)范化的維表 , 雪片模型維表 易于維護(hù) , 節(jié)省存儲(chǔ)空間 ;
- 雪片模型缺點(diǎn) : 雪片模型 查詢時(shí) , 需要 進(jìn)行較多的連接操作 , 影響系統(tǒng)性能 ;
3、事實(shí)星座
該模型 比 星型模式 , 雪片模型 更復(fù)雜 , 上述兩個(gè)模型 , 只有一個(gè)事實(shí)表 , 但是 在事實(shí)星座模型中 , 有多個(gè)事實(shí)表 , 兩個(gè)事實(shí)表 , 可能公用一些維表 ;
四、在線分析處理
在線分析處理 : 一類(lèi)軟件技術(shù) , 分析人員 , 管理人員 利用該技術(shù) , 從 多種視角 , 通過(guò) 快速 , 一致 , 交互 的訪問(wèn)數(shù)據(jù) , 達(dá)到 對(duì)數(shù)據(jù)洞察 ;
五、多維數(shù)據(jù)分析操作
多維數(shù)據(jù)分析操作 :
切片 : 在 數(shù)據(jù)方體 某一維 , 選定一個(gè) 維成員 ;
切塊 : 在 數(shù)據(jù)方體 某一維 , 選定 某個(gè)區(qū)間的 維成員 ;
旋轉(zhuǎn) : 改變 數(shù)據(jù)方體 維次序 ;
下鉆 : 分析過(guò)程中 , 用戶需要從 更多維 或者 某個(gè)維更細(xì)層次上 觀察數(shù)據(jù) , 前者 增加更多的維 , 后者 在現(xiàn)有維上鉆取到更細(xì)一層的數(shù)據(jù) ;
上卷 : 分析過(guò)程中 , 用戶需要從 更少維 或者 某個(gè)維更粗層次上 觀察數(shù)據(jù) , 前者 減少一個(gè)維后分析 , 后者 上卷到現(xiàn)有的某個(gè)維的更高層次進(jìn)行分析 ;
總結(jié)
本博客中從各個(gè)角度分析了 數(shù)據(jù)倉(cāng)庫(kù) 與 數(shù)據(jù)塊 的區(qū)別 , 簡(jiǎn)要介紹了數(shù)據(jù)倉(cāng)庫(kù)體系結(jié)構(gòu) , 多維數(shù)據(jù)模型的三種模型結(jié)構(gòu) , 以及在多維數(shù)據(jù)模型中的數(shù)據(jù)分析操作 ;
總結(jié)
以上是生活随笔為你收集整理的【商务智能】数据仓库 ( 多维数据模型 | 多维数据分析 )的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: 【商务智能】数据预处理
- 下一篇: 【商务智能】商务智能 ( 概念 | 组成