Orange(オレンジ)とはデータマイニングソフトウェアです。初心者から専門家までのニーズに対応できる対話型データ分析ワークフローとして利用できます。
Orangeは「データ視覚化」「機械学習」「データマイニング」「データ分析」のためのコンポーネントベースのソフトウェアパッケージです。
「探索的なデータ分析」と「対話的なデータ視覚化」のためのビジュアルプログラミングフロントエンドを特徴としています。
データ処理に関するさまざまな「前処理機能」「調査機能」「モデリング機能」「視覚化機能」が含まれ、上級ユーザーはPythonプログラミング用ライブラリとしても活用できます。
Orangeは、スロベニアの「University of Ljubljana(リュブリャナ大学)」を中心として開発が進められています。
・1996年:初版リリース
Orangeのライセンスは「GNU General Public License 3.0 or any later version」です。
詳細について、こちらを参照ください。
→Orange →License
Orangeは「Windows」「macOS」「Linux」で動作します。
同様な機能を提供する製品として、次のようなものがあります。
オープンソース製品:「RapidMiner Studio」「Weka」「Pentaho」など。
Orangeのデータ視覚化機能は「隠されたデータパターンの発見」「データ分析手順の背後にある直感の提供」「データサイエンティストとドメインエキスパート間のコミュニケーション」などをサポートできます。
ビジュアライゼーションウィジェットにより多様な視覚化を実施できます。
・散布図
・ボックス図
・ヒストグラム
・樹状図
・シルエット図
・ツリー図
・ワードクラウド
・地理的地図 など
→Orange →Interactive Data Visualization
Orangeはデータ分析機能も提供します。さまざまな分析手法によりデータ探索を実施できます。
・統計分布
・箱ひげ図
・散布図
・ディシジョンツリー
・階層的クラスタリング
・ヒートマップ
・線形予測 など
Orangeのコンポーネントは「ウィジェット」と呼ばれ各種機能を提供します。
・データ視覚化
・サブセット選択
・前処理
・学習アルゴリズムの経験的評価
・予測モデリング など
Orangeにおいて、ユーザーはさまざまなウィジェットを配置してデータ分析ワークフローを作成できるキャンバスインターフェースが提供されています。ユーザーは対話的な視覚化探索によりデータマイニングを実施できます。
また、面倒なコーディングを必要とせずに、複雑なデータ分析パイプラインを構築できます。
Orangeは理解しやすいビジュアルプログラミング機能により、データ科学教育に活用できるソフトウェアとしても注目されています。
「学校」「大学」「専門的トレーニングコース」などで、「データサイエンス概念教育ツール」や「実践的トレーニングツール」として活用されています。
→Orange →Education in Data Science
参考元サイト
※定期的にメンテナンスを実施しておりますが、一部情報が古い場合がございます。ご了承ください。
OSS×Cloud ACCESS RANKING