ETL开发工具KETTLE使用教程
Kettle的建立數(shù)據(jù)庫連接、使用kettle進(jìn)行簡單的全量對比插入更新:kettle會自動對比用戶設(shè)置的對比字段,若目標(biāo)表不存在該字段,則新插入該條記錄。若存在,則更新。
?
Kettle簡介:Kettle是一款國外開源的ETL工具,純java編寫,可以在Window、Linux、Unix上運(yùn)行,數(shù)據(jù)抽取高效穩(wěn)定。Kettle 中文名稱叫水壺,該項(xiàng)目的主程序員MATT 希望把各種數(shù)據(jù)放到一個(gè)壺里,然后以一種指定的格式流出。Kettle這個(gè)ETL工具集,它允許你管理來自不同數(shù)據(jù)庫的數(shù)據(jù),通過提供一個(gè)圖形化的用戶環(huán)境來描述你想做什么,而不是你想怎么做。Kettle中有兩種腳本文件,transformation和job,transformation完成針對數(shù)據(jù)的基礎(chǔ)轉(zhuǎn)換,job則完成整個(gè)工作流的控制。(引用百度百科)
1、Kettle的下載與安裝(在本文中使用的kettle版本為6.1.0.1-196)
2、打開kettle。
首先解壓下載下來的壓縮包如:pdi-ce-6.1.0.1-196.zip
然后打開Spoon.bat,如圖所示:
打開后請耐心等待一會兒時(shí)間。
3、建立轉(zhuǎn)換。
在文件->新建裝換。
新建轉(zhuǎn)換后在左邊的主對象樹中建立DB連接用以連接數(shù)據(jù)庫。如圖所示:
建立數(shù)據(jù)庫連接的過程與其他數(shù)據(jù)庫管理軟件連接數(shù)據(jù)庫類似。
注意:在數(shù)據(jù)庫鏈接的過程中,可能會報(bào)某個(gè)數(shù)據(jù)庫連接找不到的異常。那是因?yàn)槟銢]有對應(yīng)的數(shù)據(jù)庫鏈接驅(qū)動,請下載對應(yīng)驅(qū)動后,放入kettle的lib文件夾。
4、簡單的數(shù)據(jù)表插入\更新
(1)新建表插入
在左邊的面板中選擇“核心對象”,在核心對象里面選擇“輸入->表輸入”,用鼠標(biāo)拖動到右邊面板。如圖所示:
?
?
?
雙擊拖過來的表,可以編輯表輸入。
選擇數(shù)據(jù)庫連接和編輯sql語句,在這一步可以點(diǎn)擊預(yù)覽,查看自己是否連接正確。
?
(2)通過插入\更新輸出到表。
在左邊面板中選擇核心對象、選擇“輸出->插入\更新”如圖所示:
?
編輯插入更新:
首先:表輸入連接插入更新。
選中表輸入,按住shift鍵,拖向插入更新。
然后:雙擊插入更新,編輯它。
?
到這里基本上,這個(gè)轉(zhuǎn)換就要做完了,可以點(diǎn)擊運(yùn)行查看效果,看是否有誤,這個(gè)要先保存了才能運(yùn)行,可以隨意保存到任何一個(gè)地方。
5、使用作業(yè)控制上面裝換執(zhí)行。
使用作業(yè)可以定時(shí)或周期性的執(zhí)行轉(zhuǎn)換,新建一個(gè)作業(yè)。并從左邊面板拖入start 和轉(zhuǎn)換。
雙擊start可以編輯,可以設(shè)置執(zhí)行時(shí)間等等
點(diǎn)開裝換,可以設(shè)置需要執(zhí)行的轉(zhuǎn)換任務(wù),比如可以執(zhí)行上面我們做的轉(zhuǎn)換,XXX.ktr
最后點(diǎn)擊運(yùn)行即可。
?
到這里,一個(gè)簡單的通過作業(yè)調(diào)度的kettle就算做完了。
總結(jié)
以上是生活随笔為你收集整理的ETL开发工具KETTLE使用教程的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Kettle使用教程(问题)
- 下一篇: java库房仓库管理系统_Java学员作