三十九、ETL工具Kettle基础使用
生活随笔
收集整理的這篇文章主要介紹了
三十九、ETL工具Kettle基础使用
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
1. Kettle工具介紹
- Kettle是一款國外開源的ETL工具,純Java編寫,開業在Windows、Linux、Unix上運行,可以高效穩定的完成數據抽取。
- Kettle中文名叫水壺,該項目的主程序員MATT希望把各種數據放到一個壺里,然后以一種指定的格式流出
- Kettle的下載地址:https://sourceforge.net/projects/pentaho/files/Data%20Integration/3.2.0-stable/
Kettle和Informatica相比,兩者各自的優點如下表所示:
- Kettle基礎知識
- Kettle開發流程
- Kettle組件介紹
- Kettle案例介紹
2 Kettle基礎知識
-
Spoon——轉換(transform)設計工具(GUI方式):通過圖形界面來設計ETL轉換過程(transformation)和作業(Job);
-
Pan——轉換(transform)執行器(命令行方式):Pan允許批量運行有Spoon設計的ETL轉換(例如使用時間調度器),Pan是一個后臺執行的程序,沒有圖形界面。
-
Kitchen——工作(Job)執行器(命令行方式):Kitchen允許批量使用由Chef設計的任務(例如使用一個時間調度器),它也是一個后臺運行程序。
-
Carte——基于Jetty的,監聽Http請求
-
Encr——用戶加密密碼
Job和Transformation的差別:Tranformation專注于數據的ETL,而Job的范圍比較廣,可以是Tranformation,也可以是Mail、SQL、Shell和FTP等,甚至可以是另外一個Job。
3 Kettle的開發流程
Kettle的開發流程如下:
- 雙擊運行Kettle目錄下的Spoon.bat,出現kettle歡迎界面;
- 創建資料庫(可省略);
- 創建數據庫連接;
- 創建轉換;
- 創建Jobs,進行流程化控制。
4 Kettle組件介紹
4.1 數據源獲取數據
4.2 數據更新
5 Kettle隨機數案例介紹
5.1 Kettle軟件的啟動
5.2 Kettle軟件的核心對象
5.3 Kettle生成隨機數的步驟
總結
以上是生活随笔為你收集整理的三十九、ETL工具Kettle基础使用的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 三十八、商业智能与ETL基础知识
- 下一篇: 人工智能之语音识别技术(二)