kettle基础使用教程
文章目錄
- 前言
- 一、下載、安裝
- 二、啟動軟件
- 三、轉換的使用教程
- 四、作業的使用教程
- 總結
前言
Kettle簡介:Kettle是一款國外開源的ETL工具,純java編寫,可以在Window、Linux、Unix上運行,數據抽取高效穩定。Kettle 中文名稱叫水壺,該項目的主程序員MATT 希望把各種數據放到一個壺里,然后以一種指定的格式流出。
一、下載、安裝
我使用的是7.0.0.0-25版本,下載地址:https://download.csdn.net/download/longqi_123/74384214
oracle、mysql驅動文件的下載地址:文章末尾
直接下載,解壓就可以使用。
二、啟動軟件
雙擊 Spoon.bat 就能啟動 kettle 。
三、轉換的使用教程
1.點擊 文件->新建->轉換
2.在主對象樹中點擊DB連接,新建數據庫連接。
3.配置數據庫連接,配置完可以點測試進行驗證連接是否成功,在連接數據庫是需要下載mysql驅動,否則會報找不到驅動錯誤,將驅動文件放在lib文件夾下,mysql驅動文件的下載地址:https://download.csdn.net/download/longqi_123/74324757
4.在核心對象中找到輸入文件,將表輸入拖動到右邊的方框中即可。
5.雙擊右側拖入的表輸入控件,選擇數據庫連接和輸入sql語句。
6.在核心對象中找到插入/更新控件,將插入/更新拖動到右邊的方框中即可。
7.按住 Shift 鍵,點擊表輸入拖動鼠標把表輸入和插入/更新用線將兩個控件連接起來,使數據可以進行相互傳輸。
8.雙擊插入/更新,進行配置目標數據庫連接和更新的數據表以及對應的表字段。
9.點擊運行,就實現了數據的傳輸。運行結束后可以看到運行的條數,時間等。
四、作業的使用教程
需要定時更新數據,就會用到作業。
1.新建一個作業
2.從左側依次拖動 START 、轉換、成功到右側,并用線連接起來。
3.雙擊START,配置我們需要定時運行轉換
4.雙擊轉換,選擇需要運行的轉換文件
5.點擊運行,這個作業就處于運行狀態,根據設置的時間節點運行,運行成功后可以看到運行的作業量度。
到這里,一個簡單的kettle的轉換與作業就完成了,希望對你有所幫助。
總結
kettle 是一個非常強大的 ETL 工具,通過圖形化界面的配置,可以實現數據遷移,并不用開發代碼。
參考地址:
https://blog.csdn.net/longqi_123/article/details/122343170
https://www.likecs.com/show-203249525.html
上面這篇博客寫的相對比較詳細,本人根據實際操作過程中遇到的問題,列出幾項需要注意的問題:
不管是連接mysql還是oracle數據庫,需要把相應的驅動jar包復制到kettle的lib目錄下,要重啟。
- oracle的連接方式要注意,只需要填寫“數據庫名稱”即可,端口和主機名/SID直接拼接在后面
主機名稱:不用填
數據庫名稱:填寫域名或者IP:端口/服務名
數據表空間:不用填
索引表空間:不用填
端口號:-1,因為再填寫數據庫名稱時已經填寫,所以這里填寫-1
用戶名:用戶名
密碼:密碼
mysql和oracle連接驅動所需jar包地址:
鏈接:https://pan.baidu.com/s/1ErGP7AHBXzt4DEzNg8Rl7w?pwd=auht
提取碼:auht
總結
以上是生活随笔為你收集整理的kettle基础使用教程的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 利用NXlog采集Windows系统日志
- 下一篇: 笔记:linux中tcp_tw_reus