【DBMS 数据库管理系统】多维数据模型 ( 星型模式 | 雪片模型 | 事实群模型 | 度量 | 分布型 | 代数型 | 整体型 )
文章目錄
- 一、星型模式
- 二、星型模式 缺點
- 三、雪片模型
- 四、星型模型 雪片模型 折衷方案
- 五、事實群模型 ( 僅做了解 )
- 六、度量
一、星型模式
星型模式 是 多維數據模型 的表現形式 ;
星型模式 展示 : 中間有一個表 , 稱為 事實表 , 周圍有很多小表 , 這些表稱為 維表 ;
以 “商品” 表為例 :
- 事實表 : 描述商品的 時間 , 位置 , 供應商 , 零售價 , 商品顏色 等信息 ;
- 維表 : 時間 對應的維表 包含 年 , 月 , 日 , 時 , 分 , 秒 等字段 ; 位置 維表有 國家 , 省份 , 地區 , 城市 , 街道 等字段信息 , 供應商 維表 有 公司名稱 , 法人 , 稅號 , 公司注冊地點 等字段信息 ;
- 事實表中的 度量 : 上述 零售價 , 商品顏色 沒有與維表關聯 , 是度量 ;
二、星型模式 缺點
星型模式 缺點 :
1 . 星型模式 不支持 維 的層結構 ;
- 單一維表 : 每個 維 只有一個維表 , 所有的 維層屬性 都放在一個表中 , 沒有進行規范化 ;
- 單一維表 示例 : 以上述 “商品” 事實表的 時間 對應的維表 為例 , 將 年 , 月 , 日 , 時 , 分 , 秒 等字段放在同一個 維表 中 , 時間維 可以變成 多個維表 , 如只包含 年月日的維表 , 只包含 年 月 的維表 等 ;
2 . 數據冗余 :
- 數據冗余 : 每個 維表 都要表示所有的層 , 每個層有自己的屬性 , 有很多數據冗余 ;
- 數據冗余 示例 : 上述 時間維表 中每個商品 , 都要存儲完整的 年 , 月 , 日 , 時 , 分 , 秒 數據 , 實際上商品的 年 , 月 , 等數據 , 很多商品都是相同的 , 只記錄一次即可 , 不同所有的商品都記錄年月 信息 , 因此產生了大量的冗余數據 ;
3 . 不同維層屬性名相同查詢問題 :
- 不同維層 , 有相同的屬性 , 只能使用 換名 方式進行查詢 ;
- 不同維層 相同屬性示例 : 如 商店 事實表中 , 城市 , 省份 , 國家 , 每個層級都有一個經理 Manager , 當 查詢 Manager 屬性時 , 直接將 城市經理 , 省份經理 , 國家經理 , 都查詢出來了 , 無法查詢單獨一個級別的經理信息 ;
三、雪片模型
對于 維層次 復雜的維
- 為了 避免 冗余數據占用過多空間
- 為了 支持 不同維層 相同屬性 查詢
使用多個維表 描述復雜的維 , 這樣在 星型模型 的 星的角上 , 出現了分支 , 類似于雪花形狀 , 因此這種變種的 星型模型 稱為 “雪片模型” ;
雪片模型示例 : 以 “商品” 表為例
- 事實表 : 描述商品的 時間 , 位置 , 供應商 , 零售價 , 商品顏色 等信息 ;
- 第一層維表 : 時間 對應的維表 包含 日 , 時 , 分 , 秒 等字段 ; 位置 維表有 城市 , 街道 等字段信息 , 供應商 維表 有 公司名稱 , 法人 , 稅號 , 公司注冊地點 等字段信息 ;
- 第二層維表 : 時間表的第一層維表的 日 , 又使用 第二層維表表示 , 該維表中有 年 , 月 , 日 , 三個維度的信息 ; 地區表 的第一層維表的 城市 , 使用第二層維表 表示 , 該第二層維表有 國家 , 省份 , 城市 , 三個維度的信息表示 ;
- 事實表中的 度量 : 上述 零售價 , 商品顏色 沒有與維表關聯 , 是度量 ;
雪片模型 優缺點 :
- 雪片模型優點 : 雪片模型的維表是規范化的維表 , 雪片模型維表 易于維護 , 節省存儲空間 ;
- 雪片模型缺點 : 雪片模型 查詢時 , 需要 進行較多的連接操作 , 影響系統性能 ;
雪片模型 更好的 體現了 維層結構 ,
- 對于專業的數據庫 建模 設計人員 , 更容易理解 , 分析 ;
- 對于 普通用戶 來說 , 比較復雜 ;
四、星型模型 雪片模型 折衷方案
推薦采用一種 星型模型 和 雪片模型 折衷方案 , 將 星型模式 與 雪片模式 結合使用 ;
-
大維表節省空間 : 針對 大維表 , 規范化 , 節省存儲空間 ;
-
小維表效率優先 : 對于 小維表 , 采用不規范化的形式 , 避免因為查詢時 , 過多的表連接 , 引起性能降低 ;
五、事實群模型 ( 僅做了解 )
該模型 比 星型模式 , 雪片模型 更復雜 , 上述兩個模型 , 只有一個事實表 , 但是 在事實群模型中 , 有多個事實表 , 兩個事實表 , 可能公用一些維表 ;
六、度量
數據方體 中的度量 , 可以分為三種不同的類型 :
- 分布型
- 代數型
- 整體型
分布型 度量 :
- 特點 : 可以累加 ;
- 示例 : 求和 , 計數 , 求最小值 , 求最大值 ;
代數型 度量 :
- 特點 : 無法累計 ; 但是可以轉換成 分布式 度量 ;
- 示例 : 求平均值 , 無法累加 , 但是可以轉成 先求和 , 然后再計算平均值 的 分布性 度量 ;
整體型 度量 :
- 特點 : 必須有所有的值才能計算 , 無法累加 ;
- 示例 : 求中間值 , 求前 KKK 個最大值 , 排名 , 必須統計完整數據 , 才能計算出來 ;
總結
以上是生活随笔為你收集整理的【DBMS 数据库管理系统】多维数据模型 ( 星型模式 | 雪片模型 | 事实群模型 | 度量 | 分布型 | 代数型 | 整体型 )的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 【DBMS 数据库管理系统】OLAP 核
- 下一篇: 【计算机网络】计算机网络 相关概念 (