Flink从入门到精通100篇(八)-美团点评是如何在 Flink平台建立 实时数仓的?
生活随笔
收集整理的這篇文章主要介紹了
Flink从入门到精通100篇(八)-美团点评是如何在 Flink平台建立 实时数仓的?
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
前言
本文根據 Apache Flink 系列直播整理而成,由美團點評數據系統研發工程師黃偉倫老師分享。主要內容如下:
-
實時數倉建設目的
-
如何建立實時數倉
-
倉庫質量保證
實時數倉建設目的
實時數倉是一個很容易讓人產生混淆的概念。實時數倉本身似乎和把 PPT 黑色的背景變得更白一樣,從傳統的經驗來講,我們認為數倉有一個很重要的功能,即能夠記錄歷史。通常,數倉都是希望從業務上線的第一天開始有數據,然后一直記錄到現在。
但實時處理技術,又是強調當前處理狀態的一門技術,所以我們認為這兩個相對對立的方案重疊在一起的時候,它注定不是用來解決一個比較廣泛問題的一種方案。于是,我們把實時數倉建設的目的定位為解決由于傳統數據倉庫數據時效性低解決不了的問題。
由于這個特點,我們給定了兩個原則:
-
傳統數倉能解決的問題,實時數倉就不解決了。比如上個月的一些歷史的統計,這些數據是不會用實時數倉來建設的。
-
問題本身就不太適合用數倉來解決,也不用實時數倉解決。比如業務性很強的需求,或者是對時效性要求特別高的需求。這些需求我們也不建議通過實時數倉這種方式來進行解決。
當然為了讓我們整個系統看起來像是一個數倉,我們還是給自己提了一些要求的。這個要求其實跟我們建立離線數倉的要求是一樣的,首先實時的數倉是需要面向主題的,然后具有集成性,并且保證相對穩定。
離線數倉和實
總結
以上是生活随笔為你收集整理的Flink从入门到精通100篇(八)-美团点评是如何在 Flink平台建立 实时数仓的?的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 字节跳动 ClickHouse 在 A/
- 下一篇: 使用matlab调用Oracle数据库