数据仓库建设从0到1-一文带你深入建设金融数仓体系
前言
本文講述了金融數(shù)據(jù)倉庫從無到有的整體設(shè)計思路,以及對數(shù)據(jù)建模、質(zhì)量控制、元數(shù)據(jù)管理及開發(fā)規(guī)范各方面的經(jīng)驗思考,希望對大家在數(shù)倉建設(shè)工作方面有所幫助。
背景
自2018年以來,隨著業(yè)務(wù)體系的不斷豐富與發(fā)展,數(shù)據(jù)分析與應(yīng)用需求越來越豐富,對金融數(shù)據(jù)倉庫建設(shè)的要求也越來越迫切。
金融數(shù)據(jù)倉庫建設(shè)需要解決的問題,主要包括如下幾點(diǎn):
1、數(shù)據(jù)存儲和組織不成體系,數(shù)據(jù)集成的開發(fā)、維護(hù)及分析應(yīng)用成本高;
2、數(shù)據(jù)質(zhì)量缺乏定義,缺乏有效統(tǒng)一的數(shù)據(jù)質(zhì)量監(jiān)控體系;
3、缺失元數(shù)據(jù)規(guī)范管理,數(shù)據(jù)開發(fā)、表結(jié)構(gòu)定義不統(tǒng)一,數(shù)據(jù)任務(wù)、數(shù)據(jù)表維護(hù)成本高;
綜上,數(shù)據(jù)倉庫的建設(shè),將根據(jù)數(shù)倉建模方法論,構(gòu)建一整套架構(gòu)合理,并具有元數(shù)據(jù)管理和數(shù)據(jù)質(zhì)量監(jiān)控的現(xiàn)代數(shù)倉體系。
大數(shù)據(jù)領(lǐng)域建模綜述
1、為什么需要數(shù)倉建模
業(yè)界認(rèn)為數(shù)據(jù)倉庫是一個面向主題的、集成的、相對穩(wěn)定的、反映歷史變化的數(shù)據(jù)集合。數(shù)據(jù)在數(shù)倉中進(jìn)行有序、有結(jié)構(gòu)地分類組織和存儲。通過建立適合業(yè)務(wù)和基礎(chǔ)數(shù)據(jù)存儲環(huán)境的模型,可以帶來以下優(yōu)點(diǎn):
1) 成本降低:減少數(shù)據(jù)冗余,計算結(jié)果復(fù)用;
2) 性能提升:快速查詢數(shù)據(jù),減少數(shù)據(jù)的I/O吞吐;
3) 效率提高:提高用戶的使用數(shù)據(jù)體驗,使用數(shù)據(jù)效率;
4) 質(zhì)量改善:解決數(shù)據(jù)統(tǒng)計口徑的不一致性,統(tǒng)一對外的數(shù)據(jù)發(fā)布
總結(jié)
以上是生活随笔為你收集整理的数据仓库建设从0到1-一文带你深入建设金融数仓体系的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: MATLAB实战系列(三十五)-MATL
- 下一篇: Tableau实战系列数据连接及数据准备