Pentaho(ペンタホ)。BI(Business Intelligence)に必要なすべての機能が用意されている、プロフェッショナル向けのオープンソースBIスイート製品です。

オープンソースのBIツール/Pentahoとは

Pentaho(ペンタホ)。BI(Business Intelligence)に必要なすべての機能が用意されている、プロフェッショナル向けのオープンソースBIスイート製品です。

関連セミナー講演資料

Pentaho(ペンタホ)とは、BI(Business Intelligence)に必要なすべての機能が用意されている、プロフェッショナル向けのオープンソースBIスイート製品です。

目次

「Pentaho」基本情報
・概要
・主な機能
・同様製品(概要情報)
・導入事例
・ライセンス情報
・ダウンロード

ざっくりわかる「Pentaho」
第1回 Pentahoとは(入門編)
・参考サイト
  ・Pentahoオフィシャルサイト
  ・Pentaho日本語サイト
  ・Pentahoの必要スペック
  ・Pentaho解説
  ・Pentahoブログ
第2回 Pentahoのダウンロードとインストール
・参考サイト
  ・Pentaho(Community Edition) ダウンロードサイト
  ・Linux(CentOS7)編
  ・Windows編
  ・Mac編
第3回 Pentahoの「Data Integration」とは
・「Pentaho Data Integration(Kettle)」概要
・参考サイト
  ・「Pentaho Data Integration」オフィシャルサイト
  ・「Pentaho Data Integration」インストール方法
  ・「Pentaho Data Integration」概要解説
  ・「Pentaho Data Integration」の使い方
第4回 Pentahoの「Spoon」とは
・Pentahoの構成
・「Spoon」とは
・参考サイト
  ・Spoon DB→データ加工→Excel出力
  ・Spoon Salesforce→データ加工→Excel出力
  ・Spoon csvファイル→データ加工→Elasticsearchへ一括登録
第5回 Pentahoの「Pentaho Reporting」とは
・「Pentaho Reporting」概要
  ・「Pentaho Reporting」の構成
  ・入力データ
  ・出力形式
  ・出力先
  ・他のアプリケーションに組み込み可能
・参考サイト
  ・「Pentaho Reporting」オフィシャルサイト
  ・「Report Designer」でのレポート作成手順
  ・レポート書式設定
  ・「ページヘッダ/フッター領域」の設定方法

TOPに戻る

「Pentaho」基本情報

概要

【BI(Business Intelligence)製品とは】
「企業内の膨大なデータ」や「企業外の事実に基づくデータ」などの膨大なデータに対して、組織的かつ系統的に蓄積/分類/検索/分析/加工して、ビジネス上の各種意思決定に有用となる知識や洞察を生み出すという概念や仕組みを意味します。

【基本説明】
Pentahoは、ETL、OLAP、クエリー&レポーティング、インタラクティブ分析、ダッシュボード、データマイニング、BIプラットフォームなどのBIのためのあらゆる機能を網羅しているBIオールインワンパッケージです。データ統合から分析までを一貫して行うことができます。
商用BI製品と同等の機能と性能を提供しています。
各機能ごとに、GUIが用意されているため、複雑なロジックを作成せずに、各機能を使用することができます。
ビッグデータ統合のための接続部品が豊富に揃っています。高速/分散処理アーキテクチャHadoopと連携することができるため、大規模データも短時間で処理できます。

【無償版と有償版】
Pentahoは、開発コミュニティによって提供される無償版「Community Edition」と、Pentaho社が販売する機能拡張した有償版「Enterprise Edition」があります。

主な機能

【データ統合機能】
直感的なドラッグ&ドロップ操作で、さまざまなオブジェクトを組み合わせて、データ変換とジョブを作成し、DWH(データウエアハウス)を構築できます。

【アナライザー機能】
作成されたDWH(データウエアハウス)に対して、多次元分析データ項目のドラッグ&ドロップでOLAP分析対象を指定できます。スライス、ドリルダウンのような分析軸の変更も可能です。
「Weka」や「R」のようなデータマイニングツールとの連携もサポートされています。ビッグデータに対しても、有効的な分析ができます。

【インタラクティブ分析】
高速ROLAP(リレーショナルOLAP)エンジン「Mondrian」が多次元分析を可能にします。直感的操作により、欲しい情報をスピーディに表示できます。

【レポーティング機能】
データ分析結果をレポートとして出力できます。レポートフォーマット定義画面へのドラッグ&ドロップによってレイアウト設定を行えます。

【ダッシュボード機能】
モニタリングしたい情報について、リッチでインタラクティブな表示を行えます。

【Pentaho for Big Data MapReduce & Instaview】
「MapReduce」開発のためのUIで、ビッグデータ分析のセルフサービス化機能です。

【データマイニング&予測分析機能】
グラフィカルなインタフェースで、高度なデータマイニングを操作できます。膨大なデータから、法則性、相関関係、隠れたパターンを分析して発見するための機能です。

Pentaho画面サンプルなど

データ統合(ETL)

Pentahoデータ統合機能

Pentahoアナライザー画面

Pentahoアナライザー画面

Pentahoエンタープライズ レポーティング画面

Pentahoエンタープライズ レポーティング画面

Pentahoダッシュボード画面

Pentahoダッシュボード画面

Pentahoインタラクティブレポーティング画面

Pentahoインタラクティブレポーティング画面

Big Dataプラットフォーム

Pentaho for Big Data MapReduce & Instaview

データマイニング解析

Pentahoデータマイニング解析

同様製品(概要情報)

同様な機能を提供する製品として、次のようなものがあります。

商用製品:「Oracle BI Cloud」など。

導入事例

Pentahoは、OSSベースのトップクラス製品でありワールドワイドでの豊富な実績があります。中小規模からエンタープライズ規模まで、さまざまな領域で幅広く利用されています。

ライセンス情報

Pentaho無償版「Community Edition」は、「GNU General Public License」です。このライセンスに従うことを条件として、ソースコードの改変と公開が許可されています。

Pentaho有償版「Enterprise Edition」は、商用ライセンスとなります。

ダウンロード

ダウンロードページ

TOPに戻る

ざっくりわかる「Pentaho」

第1回 Pentahoとは(入門編)

オープンソースBIスイート「Pentaho」について紹介します。

参考サイト

【Pentahoオフィシャルサイト】

ポイント
「Pentaho」のオフィシャルサイト(英語版)です。

テーマ
・Product
・Solutions
・Services
・Customers
・Partners
・Resources

ページリンク
→Pentahoオフィシャルサイト

【Pentaho日本語サイト】

ポイント
Pentahoの日本語サイトです。Pentahoに関する最新の情報を参照できます。

テーマ
・ホーム
・製品
・サービス
・サポート
・導入事例
・購入
・ソリューション
・ダウンロード

ページリンク
→Pentaho日本語サイト(日本正規代理店KSKアナリティクス)

【Pentahoの必要スペック】

ポイント
Pentahoに関する詳細スペックを参照できます。
・クライアント側OS
  ・OS
  ・プロセッサ
  ・メモリ容量
  ・ディスク容量
・サーバ側
  ・OS
  ・対応プロセッサ
  ・必要メモリ容量
  ・必要ディスク容量
  ・その他動作環境 など

テーマ
・特徴 ビッグデータ、IoT…データ分析・活用をコストを抑えて実現
  ・BI/BAに必要な各種モジュールを提供
  ・TCOを抑えて利用することができる
・スペック

ページリンク
→キーマンズネット →BIの製品比較・一覧 →製品詳細 →オープンソースBI「Pentaho」

【Pentaho解説】

ポイント
Pentahoに関して、体系的に紹介されています。

テーマ
・Pentahoとは
・Pentahoの特徴
  ・オープンソース・オープンスタンダード
  ・段階的な拡張を可能にする柔軟なアーキテクチャ
  ・先進技術への迅速な対応
・Why Pentaho?
  ・世界で最も人気があるエンタープライズ向けオープンソースBIスイート
  ・製品の継続的な成長
  ・All in one
・機能リスト
  ・データ統合 (ETL)
  ・アナリシス
  ・レポート
  ・ダッシュボード
  ・データマイニング
・活用例
  ・経営データ分析
  ・業務KPIのモニタリング
  ・各種統計データや過去資料の見える化

ページリンク
→Aegif →BI : Pentaho

【Pentahoブログ】

ポイント
KSKアナリティクスによるPentahoに関するブログです。Pentahoに関する情報を中心として、最新情報や技術的情報を参照できます。

テーマ
・Pentaho7.0がリリースされました!
・Best Practice:Pentaho Data Integration Design Guidelines①
・インタラクティブレポート 日付の範囲でデータの絞り込み
・Pentaho社の東京オフィス開設
・GCPNEXT World Tour in Tokyo
・Pentahoにおけるキャッシュについて
・PentahoCE×Saikuハンズオン ③Saikuでレポート作成ならびにフィルタリング
・ユーザーコンソール上に登録されているキューブの一覧を取得
など

ページリンク
→オープンソースBIのPentaho(ペンタホ)ブログ

TOPに戻る

第2回 Pentahoのダウンロードとインストール

Pentahoの環境別インストール方法について紹介します。

参考サイト

【Pentaho(Community Edition) ダウンロードサイト】

ポイント
Pentaho(Community Edition)のダウンロードサイトです。ツール単位でダウンロードできます。

テーマ
・MAIN DOWNLOADS
  ・Business Analytics Platform
  ・Data Integration
  ・Report Designer
  ・Marketplace
・DESIGN TOOLS
  ・Aggregation Designer
  ・Schema Workbench
  ・Metadata Editor
・BIG DATA
  ・Hadoop Shims

ページリンク
→Pentahoオフィシャルサイト →Pentaho Community Edition →Downloads

【Linux(CentOS7)編】

ポイント
「CentOS7」に「Pentaho: 5.3.0」をインストールする方法がまとめられています。「Community Edition」と「Enterprise Edition」の両方をインストールしています。

テーマ
・はじめに
・環境
・必要パッケージのインストール
  ・Pentaho BAサーバーのインストール
  ・Pentaho BAサーバーのダウンロード
  ・Pentaho BAサーバーの起動
  ・確認
・PentahoEEインストール
  ・Download
  ・転送
  ・インストール
  ・起動
・自動起動設定
・MySQL JDBCのインストール
  ・ダウンロード
  ・インストール
・アクセスしてみる
・おわりに

ページリンク
→Qiita →Memo: Pentaho BAサーバーインストール

【Windows編】

ポイント
Windowsに「Pentaho Community Edition(Ver6)」をインストールする手順がまとめられています。
プラグインの利用方法についても解説されています。

テーマ
・Pentahoをダウンロードする
・Javaをセットアップする
・ダウンロードしたファイルを解凍
・Pentahoサーバを起動
・Plug-inの利用
  ・CDF(Community Dashboards Framework)
  ・CDA(Community Data Access)
  ・CDE(Community Dashboard Editor)

ページリンク
→ぱーくん plus idea →Pentaho BIサーバ Community Edition(Ver6)をWindowsでインストールして動かしてみたよ

【Mac編】

ポイント
Macに「Pentaho Community Edition」をインストールする手順がまとめられています。
基本的な機能に関するウォークスルーも確認できます。

テーマ
・ダウンロード
  ・Pentahoサイト →「Pentaho.com」から、「Community」へ →Downloadのセクション
  ・Main Download
・セットアップ
  ・Java8 SDKをインストール
  ・「Business Analytics Platform」のダウンロードしたzipファイルを展開
  ・「start-pentaho.sh」を実行
  ・localhostの8080番へアクセス
  ・Pentahoセットアップは終了
・ウォークスルー
  ・ファイル検索
  ・「Public」ー「Steel Wheels」ー「Analytics」
  ・WebベースのPivotテーブル
  ・「Home Dashboard」
  ・「データソース管理」

ページリンク
→Hatena Blog →pentaholabのブログ →Pentaho コミュニティ版をインストールしてみる #pentaho

TOPに戻る

第3回 Pentahoの「Data Integration」とは

「Pentaho Data Integration(Kettle)」概要

「Pentaho Data Integration(PDI)」とは、オープンソースのETLツールです。

【ETLツールとは】
・「ETL」は「Extract Transform Load」の略
・データについて「入力→変換→出力」を行うツール
・「変換」=「重複行排除」「列名前変更」「型変更」「データJOIN」など
・フローを可視化できるため管理が容易

【「Pentaho Data Integration(PDI)」とは】
・「Kettle」とも呼ばれる
・強力な「抽出」「変換」「ローディング(ETL)」機能を提供
・洗練されたユーザインターフェース
・直観的でグラフィカルなドラッグ&ドロップ設計環境
・画期的なメタデータ駆動型アプローチ
・PentahoのBIツール「Business Analytics Platform」とは独立して単独で利用できる
・データフロー定義ファイルはxml(git上で管理できる)

【ポイント】
・オープンソース(Apache License 2.0)
・日立製作所が公開
・公式サイトからダウンロードして無料で使用可能

参考サイト

【「Pentaho Data Integration」オフィシャルサイト】

ポイント
「Pentaho Data Integration(PDI)」のオフィシャルサイトです。各種公式情報を参照できます。

テーマ
・Description
・Main Concepts
・Contribute
・FREQUENTLY ASKED QUESTIONS
・Download

ページリンク
→Pentaho(Community)オフィシャルサイト →Data Integration - Kettle

【「Pentaho Data Integration」インストール方法】

ポイント
Windows/Macへ「Pentaho Data Integration(PDI)」をインストール方法について紹介されています。

テーマ
・概要
・ダウンロード
・インストール
  ・
  ・
・関連書籍

ページリンク
→データの達人 →Pentaho Data Integrationのインストール方法

【「Pentaho Data Integration」概要解説】

ポイント
「Pentaho Data Integration」などのツールを使用して、ETL処理を行なう一連の流れについて解説されています。

テーマ
・システムの概要
  ・データ収集
  ・ETL処理
  ・BI
・主要技術紹介
  ・Scrapy
  ・Pentaho Data Integration
  ・Tableau Public
・データ収集から変換、可視化、公開までの流れ
  ・どういう問いに答えたいかを考える
  ・スキーマの全体像を作る
  ・データを収集する
  ・ETL処理を記述する
  ・データを分析する
  ・分析結果を公開する

ページリンク
→Qiita →Webページのスクレイピングと分析・可視化

【「Pentaho Data Integration」の使い方】

ポイント
「Pentaho Data Integration」の使い方について「基本的な流れ」「各機能の使用方法」などについて解説されています。

テーマ
・データ変換の流れ
・基本的な使い方
  ・処理の追加
  ・データフローの接続
  ・プレビュー
・個別のアイコンの説明
・入力
  ・CSV入力
  ・JSON 入力
・変換
  ・シーケンス追加
  ・定数追加
  ・文字列オペレーション
  ・行整列
  ・計算
  ・選択/名前変更
  ・重複行削除
・フロー
  ・フィルター
・結合
  ・マージ結合
・出力
  ・テキストファイル出力
・その他
  ・ステップ間のレコード数

ページリンク
→Qiita →Pentaho Data Integration メモ

TOPに戻る

第4回 Pentahoの「Spoon」とは

Pentahoの構成

「Pentaho」は、複数のツール/Webアプリケーションが統合された総称を意味しています。

Pentahoの中の1つの機能として、ETLツール「Pentaho Data Integraion(PDI)」があります。
・「Kettle」という別名
・「Kettle」=「Kettle Extraction Transformation Transportation & Loading Environment」

「Kettle」の配下にも複数のツール(コンポーネント類)が存在しています。
1.「Spoon(スプーン)」 ETLモデリングツール(GUI)
2.「Pan(パン)」 Transformationを実行(コマンドラインツール)
3.「Kitchen(キッチン)」 Jobを実行(コマンドラインツール)
4.「Carte(カルテ)」 Webサーバ(TransformationやJobを実行)

「Spoon」とは

「Spoon」とは、ETLモデリングを行なうGUIアプリケーションです。

「Spoon」の主な機能
・データ抽出
・データ加工
・データエクスポート
・ジョブ定義
・ジョブ手動実行
・OLAP分析
・レポート作成 など

参考サイト

【Spoon DB→データ加工→Excel出力】

ポイント
Spoonを使用して、データベース(PostgreSQL)からデータを抽出して、データ加工を行い、Excelファイルとして出力する方法についてまとめられています。

テーマ
・バイナリを入手する
・Spoonを起動する
・新しいTransformationを作成する
・新しいデータベース接続を追加する
・Transformationを編集する

ページリンク
→Hatena Blog →M12i. →PentahoのSpoonを起動してTransformationを編集する

【Spoon Salesforce→データ加工→Excel出力】

ポイント
Spoonを使用して、Salesforceデータを取り込み、データ加工後、Excelファイルへエキスポートする手順についてまとめられています。

テーマ
・Pentaho(Spoon)でできること
・Pentaho(Spoon)のインストールと起動
・Salesforceへの接続
・Salesforce Inputの作成
・エクセルへの出力の作成

ページリンク
→ぱーくん plus idea TOP →PentahoのETLツール「Spoon」でSalesforceのデータをエクセルにエクスポートする

【Spoon csvファイル→データ加工→Elasticsearchへ一括登録】

ポイント
Spoonを使用して、csvファイルを取り込み、Elasticsearchへ一括登録を行なう方法についてまとめられています。

テーマ
・はじめに
・PENTAHOとは?
・環境準備
  ・PDIダウンロード
  ・サンプルCSVファイルダウンロード
・起動
・実行計画作成
  ・CSVファイルの読み込み
  ・データソースの作成
  ・CSV→RESTコマンド変換スクリプトの作成
  ・UPSERTコマンド例
  ・登録先情報の作成(ElasticSearchサーバ:)
  ・ログの出力設定
  ・実行
  ・結果確認
・注意点
  ・大量データ登録の際のOutofMemorryエラー
・まとめ

ページリンク
→Qiita →ElasticsearchにPDI (Spoon)を使って一括登録を行う方法

TOPに戻る

第5回 Pentahoの「Pentaho Reporting」とは

「Pentaho Reporting」概要

「Pentaho Reporting」とは、オープンソースのレポートツールスイートです。
多種多様なデータソースからさまざまなレポートを作成できます。

【「Pentaho Reporting」の構成】
「Pentaho Reporting」は複数のツールで構成されています。
1.「Report Designer」 レポート作成用ビジュアルデザイン環境
2.「Reporting Engine」 組み込み用ライブラリ
3.「Reporting SDK」 サポートライブラリパッケージ

【入力データ】
さまざまなデータストアからの入力が可能です。データ出所やソースデータの結合方法に制限はありません。

【出力形式】
多くの出力形式に対応しています。
・PDF
・Excel
・HTML
・テキスト
・リッチテキストファイル
・XML形式 など

【出力先】
・ファイルとして保存
・電子メールで送信 など

【他のアプリケーションに組み込み可能】
「Pentaho Reporting」は、他のアプリケーションと統合できるレポートコンポーネントとして設計されています。
必要なコンポーネントだけを使用して、独自アプリケーションにレポーティング機能として組み込むことが可能です。

参考サイト

【「Pentaho Reporting」オフィシャルサイト】

ポイント
「Pentaho Reporting」のオフィシャルサイトです。各種公式情報を参照できます。

テーマ
・Description
・Main Concept
・Contribute
・FREQUENTLY ASKED QUESTIONS
・Downloads

ページリンク
→Pentahoオフィシャルサイト(Community) →Pentaho Reporting

【「Report Designer」でのレポート作成手順】

ポイント
「Pentaho Reporting」の「Report Designer」でレポートを作成する手順についてまとめられています。

テーマ
・Pentahoの中でグラフを作成する手順
・ステップ1 - クエリを追加します
・ステップ2 - ページヘッダーに画像を追加
・ステップ3 - レポートフッターにチャートを追加します
・ステップ4 - グラフのプロパティを追加します

ページリンク
→W3im.com →Pentahoチュートリアル →Pentahoチャートレポート

【レポート書式設定】

ポイント
「Pentaho Reporting」の「Report Designer」でレポート書式設定を行なう方法についてまとめられています。

テーマ
・テキストの書式設定
・ハイパーリンクを追加します
・行バンディング

ページリンク
→W3im.com →Pentahoチュートリアル →Pentahoレポート要素の書式設定

【「ページヘッダ/フッター領域」の設定方法】

ポイント
レポートの「ページヘッダ領域」と「ページフッター領域」の設定方法についてまとめられています。

テーマ
・ステップ1 -機能ボタン(F xを )クリック
・ステップ2 - 特定の機能を選択します
・ステップ3 - フィールド名を定義します。
・ステップ4 - ワークスペースを報告する機能を追加します。
・ステップ5 - プレビューを確認してください
・Pentahoは - その他の機能

ページリンク
→W3im.com →Pentahoチュートリアル →Pentaho機能

TOPに戻る

※定期的にメンテナンスを実施しておりますが、一部情報が古い場合がございます。ご了承ください。

Pentaho最新TOPICS

【講演資料を公開】4/19「米国におけるオープンソース最新活用状況」(2017年05月19日 09:15)

2017年04月19日(水)14:30~16:30 中央区のJJK会館2階多目的ホールA にて「米国におけるオープンソース最新活用状況」と題したセミナーが開催されました。 当日は、オープンソースに関心をお持ちの方々がご来場くださり、お陰様で盛況のうちに終了することができました。皆さま熱心に公聴され、メモを執る姿も多く見受けられましたました。 また、来場者アンケートでは多くのコメントを頂戴しまし...

  • オープソース書籍(サイド)

OSS×Cloud ACCESS RANKING

  • OSSNEWSに広告を掲載しませんか?

facebook

twitter