PDIの変換は、ステップと呼ばれる論理的なタスクのネットワークであり、データフローとして表現されます。
PDIのジョブは、ETLアクティビティの「リソース」「実行」「依存関係」を調整するためのワークフローのようなモデルです。
個々の機能を集約してプロセス全体を実装します。
Pentahoリポジトリは、ジョブと変換の保存と管理に加えて、完全なリビジョン履歴を提供します。
チームで共同ETL環境が必要な場合は、Pentahoリポジトリの使用が推奨されています。
コアプラグインとして各種プラグインが提供されています。
→github.com →pentaho/pentaho-kettle →plugins
PDIは、トランスフォーメーションクラスタリングを使用する場合に、トランスフォーメーション内および複数クラスタノードにわたるデータ負荷分散機能を提供します。
ロギングは、「挿入されたレコード数」「変換に費やされた合計経過時間」など、ジョブや変換に関する要約情報を提供します。
また、例外やエラーなどの「デバッグ詳細情報」も提供します。
参考元サイト
※定期的にメンテナンスを実施しておりますが、一部情報が古い場合がございます。ご了承ください。
OSS×Cloud ACCESS RANKING