Pentaho Data Integration(ペンタホデータインテグレーション)はETLツールです。革新的なメタデータ駆動型アプローチを使用して、強力な「データ抽出」「データ変換」「データ読み込み」などを実行できます。開発経緯から「Kettle」とも呼ばれます。
Pentaho Data Integration(PDI)(Kettle)は、「変換構築」「ジョブスケジュール」などを実行できるETLデスクトップアプリケーションです。
「直感的でグラフィカルなドラッグアンドドロップ設計環境」と「実績のあるスケーラブルな標準ベースアーキテクチャ」を備えたPDIは、「キャプチャ」「クレンジング」「保存プロセス」などのデータに関する操作をシンプルに実行できます。
Pentahoが、PDIのベースとなったKettle(Kettle Extraction Transformation Transport LoadEnvironment)を買収した時に「Pentaho Data Integration」に改名されました。
・異なるデータベースおよびアプリケーション間のデータ移行
・巨大データセットをデータベースにロード
・範囲ステップによるデータクレンジング
・PentahoReportingのデータソースとしてリアルタイムETLを活用する機能を含むデータ統合
・データウェアハウス構築---少しずつ変化するディメンションと代理キー作成に対するサポート など
→community.hitachivantara.com →data-integration-kettle
→github.com →pentaho/pentaho-kettle
Pentaho Data Integrationは、community.hitachivantara.comが中心となり開発が進められています。
Pentaho Data Integrationのライセンスは「Apache License 2.0」です。
詳細について、こちらを参照ください。
→github.com →pentaho/pentaho-kettle →LICENSE.txt
「Linux」「Windows」「MacOS」がサポートされています。
→github.com →pentaho/pentaho-kettle
同様な機能を提供する製品として、次のようなものがあります。
オープンソース製品:「Talend Open Studio」など。
OSS×Cloud ACCESS RANKING