几种 ETL 工具的比较(Kettle,Talend,Informatica 等)
成本:
軟件成本包括多方面,主要包括軟件產品, 售前培訓, 售后咨詢,?技術支持等。
開源產品本身是免費的,成本主要是培訓和咨詢,所以成本會一直維持在一個較低水平。
商業(yè)產品本身價格很高,但是一般會提供幾次免費的咨詢或支持,所以采用商用軟件最初成本很高,但是逐漸下降。
手工編碼最初成本不高,主要是人力成本,但后期維護的工作量會越來越大。
?
?
風險:
項目都是有風險的尤其是大項目。
項目的風險主要包括:超出預算,項目延期,沒有達到用戶的滿意和期望
開源產品由于價格上的優(yōu)勢,可以在很大程度上降低項目的風險。
?
易用性:
Talend:有 GUI 圖形界面但是以 Eclipse 的插件方式提供。
Kettle:有非常容易使用的 GUI,出現(xiàn)問題可以到社區(qū)咨詢。
Informatica:有非常容易使用的 GUI,但是要專門的訓練。
Inaplex Inaport:沒有GUI
?
技術支持:
Talend:主要在美國
Kettle:在美國,歐洲(比利時,德國,法國,英國),亞洲(中國,日本,韓國)都可以找到相關技術支持人員。
Informatica:遍布全世界
Inaplex Inaport:主要在英國
?
部署:
Talend:創(chuàng)建?java?或perl 文件,并通過操作系統(tǒng)調度工具來運行
Kettle:可以使用 job 作業(yè)方式或操作系統(tǒng)調度,來執(zhí)行一個轉換文件或作業(yè)文件,也可以通過集群的方式在多臺機器上部署。
Informatica:需要有?Server
Inaplex Inaport:需要 .net 2.0
?
速度:
Talend:需要手工調整,對特定數(shù)據(jù)源有優(yōu)化知識。
Kettle:比 Talend 快,不過也需要手工調整,對 Oracle 和 PostGre 等數(shù)據(jù)源做了優(yōu)化,同時也取決于轉換任務的設計。
Informatica:是最快的
Inaplex Inaport:沒有使用什么優(yōu)化技術。
?
數(shù)據(jù)質量:
Talend:在 GUI 里有數(shù)據(jù)質量特性,可以手工寫?SQL?語句。
Kettle:在 GUI 里有數(shù)據(jù)質量特性,可以手工寫 SQL 語句、java腳本、正則表達式來完成數(shù)據(jù)清洗。
Informatica:專門有一個產品 Informatica Data Quality 來保證數(shù)據(jù)質量
Inaplex Inaport:因為只處理特定數(shù)據(jù),所以比較容易進行數(shù)據(jù)清洗。
?
監(jiān)控:
Talend:有監(jiān)控和日志工具
Kettle:有監(jiān)控和日志工具
Informatica:有非常詳細的監(jiān)控和日志工具
Inaplex Inaport:有監(jiān)控和日志工具
?
?
連接性:
Talend:各種常用數(shù)據(jù)庫,文件,web?service。
Kettle:非常廣泛的數(shù)據(jù)庫,文件,另外可以通過插件擴展。
Informatica:各種數(shù)據(jù)源
Inaplex Inaport:ODBC 連接
總結
以上是生活随笔為你收集整理的几种 ETL 工具的比较(Kettle,Talend,Informatica 等)的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: SAP 凭证冲销可以使用BAPI_ACC
- 下一篇: ETL工具大全