Anaconda(アナコンダ)とは、「データサイエンス」や「機械学習関連アプリケーション」のためのPythonおよびR言語用のディストリビューションです。
Anacondaは「Python本体」+「各種データサイエンスライブラリ」などをまとめたPythonパッケージで、パッケージの管理と展開の容易性を目指しています。
「データサイエンス」「機械学習アプリケーション」「大規模データ処理」「予測分析」など、PythonおよびR言語用に用意されている1500以上のデータサイエンスパッケージを簡単にインストールでき、ワンクリックで依存関係や環境を管理できます。
必要とするライブラリを1つずつインストールする手間を省くことができるため、データサイエンスや機械学習を行うための環境を即座に構築できます。
Anacondaディストリビューションは世界で1300万人以上のユーザーによって使用されており、「ソフトウェア開発」「ソフトウェアテスト」「機械学習モデルトレーニング」などの環境構築のための業界標準として利用されています。
Anacondaは、Anaconda社を中心として開発が進められています。
・2012年:初版リリース
Anacondaは多種多様な開発および研究用環境構築ツールとして利用できます。
・データサイエンス---Jupyter、JupyterLab、Spyder、RStudio
・データ分析---Dask、numpy、pandas、Numba
・データ視覚化---Matplotlib、Bokeh、Datashader、Holoviews
・機械学習およびディープラーニングモデル作成---Scikit-learn、Tensorflow、h20、Theano など
Anacondaは以下の2つのエディションで構成されています。
オープンソース版「Anaconda Distribution」はBSDライセンスの下で公開されているオープンソースソフトウェアです。
「Anaconda Distribution」は「Linux」「Windows」「Mac OS X」上でPythonおよびR言語用のデータサイエンスおよび機械学習を実行するための環境を構築できます。
→Anaconda →Anaconda Distribution
→Anaconda →Anaconda Data Science and Machine Learning Community
エンタープライズ版「Anaconda Enterprise」は、ITガバナンスとセキュリティのニーズを満たしながら、データサイエンスチームがモデルを迅速かつ大規模に「構築」「トレーニング」「展開」できるように「Anaconda Distribution」をベースとして機能拡張されています。
「Anaconda Enterprise」を使用すると次のようなケースに対応できます。
・データサイエンスと機械学習をハイスピードかつハイスケールで提供
・ユーザーのデータサイエンスと機械学習のイニシアチブの潜在能力を最大限に発揮
・デジタルインタラクションが要求するペースで「データサイエンス」「機械学習」「人工知能」を活用
・数千の共同作業チーム---単一サーバから数千ノードまでスケール
・プライベートパッケージリポジトリによる安全なオープンソースサプライチェーン など
→Anaconda →Anaconda Enterprise
Anacondaのライセンスは「the 3-clause BSD License」です。
詳細について、こちらを参照ください。
→Anaconda →Anaconda End User License Agreement
→Anaconda →Anaconda Documentation →Anaconda Distribution →Installation
→Anaconda →Anaconda Distribution
→Anaconda →Collaborate, Govern and Scale
同様な機能を提供する製品として、次のようなものがあります。
オープンソース製品:「virtualenv」「Miniconda」など。
OSS×Cloud ACCESS RANKING