ODS(Operational Data Store)定义
ODS(Operational Data Store)可操作的數(shù)據(jù)存儲。
很多人對ODS究竟是什么有很多的困惑,ODS對于不同的人可以有不同的看法,我主要說說什么是最主流的定義。首先我們需要注意,ODS不同于數(shù)據(jù)倉庫(Data warehouse)或數(shù)據(jù)集市(Data mart)。數(shù)據(jù)倉庫是用來保存公司來自很多不同的來源的歷史數(shù)據(jù),并主要將這些數(shù)據(jù)用于趨勢分析,生成報表的地方。它是一個公司很多主題域(subject area)的一個合集,它在企業(yè)中是唯一的(一個企業(yè)不會有很多個數(shù)據(jù)倉庫,那樣數(shù)據(jù)可能會對不上)、真實的(只認(rèn)可這一個數(shù)據(jù)倉庫中的數(shù)據(jù))。數(shù)據(jù)集市和數(shù)據(jù)倉庫扮演的角色一樣,只是數(shù)據(jù)倉庫包含多個主題域,而數(shù)據(jù)集市僅僅面向一個主題域。可以把數(shù)據(jù)倉庫認(rèn)為是多個數(shù)據(jù)集市組合體。
ODS的目的是集成公司不同來源的企業(yè)數(shù)據(jù),以便于實時或者接近實時地產(chǎn)生操作報告。通常ODS中數(shù)據(jù)的結(jié)構(gòu)和源數(shù)據(jù)結(jié)構(gòu)很像,盡管在數(shù)據(jù)集成的時候,可以被清理、去規(guī)范化,?還有一些數(shù)據(jù)按照公司政策來集成。這個集成是粒度最小的、一天內(nèi)發(fā)生的頻率最高的集成。通常ODS不會被設(shè)計成用來做歷史數(shù)據(jù)分析或者趨勢分析工作,這些是數(shù)據(jù)倉庫的功能。ODS通常會被用來當(dāng)做數(shù)據(jù)倉庫的數(shù)據(jù)來源。
?
總結(jié)下ODS和數(shù)據(jù)倉庫的不同之處:
~~ODS用于最低粒度的查詢用,而數(shù)據(jù)倉庫通常保存的是綜合過的、粒度較粗的數(shù)據(jù),通常用于較復(fù)雜的、分析性的查詢。
~~ODS通常實時性較高,通常保存的數(shù)據(jù)是實時的或者近乎實時的,因此能較及時地返回查詢請求,數(shù)據(jù)倉庫通常是歷史的數(shù)據(jù),通常分析的數(shù)據(jù)較多,不能做到實時返回查詢,分析需要比較長時間。
~~ODS保存的數(shù)據(jù)視窗較小,即時間跨度不大;數(shù)據(jù)倉庫保存的幾乎是一個公司的所有歷史數(shù)據(jù)。
~~ODS為當(dāng)前或接近實時數(shù)據(jù)的操作和戰(zhàn)術(shù)決策提供信息,而數(shù)據(jù)倉庫為戰(zhàn)略決策提供反饋,從而整體改進(jìn)系統(tǒng)。
~~ODS抽取數(shù)據(jù)的頻率可以是幾分鐘、幾小時;數(shù)據(jù)倉庫的抽取數(shù)據(jù)的頻率可以是每天、每周、每月、或者每季度。
?
為什么需要一個ODS的一些原因:
~~源系統(tǒng)能夠提供有限的分析能力
~~可以使用更好的、更有效的工具來做分析,而不是直接在源系統(tǒng)上做數(shù)據(jù)分析
~~可以更好地做權(quán)限控制,僅僅讓某些人訪問到公司的數(shù)據(jù),生成實時或近乎實時的報表統(tǒng)計
~~可以將公司不同的數(shù)據(jù)庫中的數(shù)據(jù)集合到一起,并基于當(dāng)天的數(shù)據(jù)做近乎實時的分析和生成報表
?
轉(zhuǎn)載于:https://www.cnblogs.com/lukairui/p/7687418.html
總結(jié)
以上是生活随笔為你收集整理的ODS(Operational Data Store)定义的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: dialogic d300语音卡驱动重装
- 下一篇: js 数组的交集、补集、并集