数据集成工具
文章目錄
- 數(shù)據(jù)集成工具
- 數(shù)據(jù)采集工具分類
- 離線采集(批量采集)
- 實(shí)時(shí)采集(增量采集)
- Flume
- Sqoop
- DataX
- Canal
數(shù)據(jù)集成工具
數(shù)據(jù)采集工具分類
離線采集(批量采集)
實(shí)時(shí)采集(增量采集)
Flume
??flume是一個(gè)分布式、可靠、和高可用的海量日志采集、聚合和傳輸?shù)南到y(tǒng)。
Sqoop
??Apache開源軟件,主要用于在HADOOP(Hive)與傳統(tǒng)的數(shù)據(jù)庫(mysql、postgresql…)間進(jìn)行數(shù)據(jù)的傳遞。
DataX
??是阿里開源軟件異構(gòu)數(shù)據(jù)源離線同步工具,致力于實(shí)現(xiàn)包括關(guān)系型數(shù)據(jù)庫(MySQL、Oracle等)、HDFS、Hive、ODPS、HBase、FTP等各種異構(gòu)數(shù)據(jù)源之間穩(wěn)定高效的數(shù)據(jù)同步功能。
Canal
??canal,譯意為水道/管道/溝渠,主要用途是基于 MySQL 數(shù)據(jù)庫增量日志解析,提供增量數(shù)據(jù)訂閱和消費(fèi)。
-
canal的數(shù)據(jù)同步不是全量的,而是增量。基于binary log增量訂閱和消費(fèi),canal可以做:
- 數(shù)據(jù)庫鏡像
- 數(shù)據(jù)庫實(shí)時(shí)備份
- 索引構(gòu)建和實(shí)時(shí)維護(hù)
- 業(yè)務(wù)cache(緩存)刷新
- 帶業(yè)務(wù)邏輯的增量數(shù)據(jù)處理
到底啦!
總結(jié)
- 上一篇: [css] border-radius
- 下一篇: [css] css中Scroll-be