Pentaho参考情報③Pentahoの「Data Integration」として、「Pentaho Data Integration(Kettle)概要」「オフィシャルサイト」「概要解説」「使い方」について紹介します。

Pentaho参考情報③Pentahoの「Data Integration」とは

Pentaho参考情報③Pentahoの「Data Integration」として、「Pentaho Data Integration(Kettle)概要」「オフィシャルサイト」「概要解説」「使い方」について紹介します。

■関連する比較ページ

Pentaho参考情報③Pentahoの「Data Integration」とは

■「Pentaho Data Integration(Kettle)」概要

「Pentaho Data Integration(PDI)」とは、オープンソースのETLツールです。

ETLツールとは

・「ETL」は「Extract Transform Load」の略
・データについて「入力→変換→出力」を行うツール
・「変換」=「重複行排除」「列名前変更」「型変更」「データJOIN」など
・フローを可視化できるため管理が容易

「Pentaho Data Integration(PDI)」とは

・「Kettle」とも呼ばれる
・強力な「抽出」「変換」「ローディング(ETL)」機能を提供
・洗練されたユーザインターフェース
・直観的でグラフィカルなドラッグ&ドロップ設計環境
・画期的なメタデータ駆動型アプローチ
・PentahoのBIツール「Business Analytics Platform」とは独立して単独で利用できる
・データフロー定義ファイルはxml(git上で管理できる)

■「Pentaho Data Integration」オフィシャルサイト

概要

「Pentaho Data Integration(PDI)」のオフィシャルサイトです。各種公式情報を参照できます。

ページリンク

→Hitachi Vantara Community →Data Integration - Kettle

■「Pentaho Data Integration」概要解説

概要

「Pentaho Data Integration」などのツールを使用して、ETL処理を行なう一連の流れについて解説されています。

解説テーマ

[システムの概要]
・データ収集
・ETL処理
・BI
[主要技術紹介]
・Scrapy
・Pentaho Data Integration
・Tableau Public
[データ収集から変換、可視化、公開までの流れ]
・どういう問いに答えたいかを考える
・スキーマの全体像を作る
・データを収集する
・ETL処理を記述する
・データを分析する
・分析結果を公開する

ページリンク

→Qiita →Webページのスクレイピングと分析・可視化

■「Pentaho Data Integration」の使い方

概要

「Pentaho Data Integration」の使い方について「基本的な流れ」「各機能の使用方法」などについて解説されています。

解説テーマ

・データ変換の流れ
・基本的な使い方
・個別のアイコンの説明
・入力
・変換
・フロー
・結合
・出力
・その他

ページリンク

→Qiita →Pentaho Data Integration メモ

Pentaho最新TOPICS

【講演資料を公開】4/19「米国におけるオープンソース最新活用状況」(2017年05月19日 09:15)

2017年04月19日(水)14:30~16:30 中央区のJJK会館2階多目的ホールA にて「米国におけるオープンソース最新活用状況」と題したセミナーが開催されました。 当日は、オープンソースに関心をお持ちの方々がご来場くださり、お陰様で盛況のうちに終了することができました。皆さま熱心に公聴され、メモを執る姿も多く見受けられましたました。 また、来場者アンケートでは多くのコメントを頂戴しまし...

イベント情報

セミナー講演資料

無料資料プレゼント

2021/03/04 セキュリティDAYS Keyspider資料

講演資料を見るには、 プライバシーポリシーに同意して、送付先メールアドレスをご入力しご請求ください。

またご入力いただきました情報は、当該資料の作成・提供企業とも共有させていただき、当社及び各社のサービス、製品、セミナー、イベントなどのご案内に使用させていただきます。

本資料を見るには次の画面でアンケートに回答していただく必要があります。



セミナー講演資料公開中

データ分析の課題をAWS Analyticsサービスで解決する方法

注目のDB技術「HTAP」とは? ~手軽に、かつ高速に、リアルタイム分析を実現する方法~

ビッグデータ処理のデータベースとして MySQL HeatWave が最適な理由 〜AWS Aurora/Redshift、GCP BigQuery との性能&コスト比較〜

  • オープソース書籍(サイド)
  • OSSNEWSに広告を掲載しませんか?

facebook

twitter