scikit-learn(サイキットラーン)とは、Pythonのオープンソース機械学習ライブラリです。機能が充実している高品質ライブラリです。

オープンソースのAI・人工知能/scikit-learnとは

scikit-learn(サイキットラーン)とは、Pythonのオープンソース機械学習ライブラリです。機能が充実している高品質ライブラリです。

基本情報

概要

scikit-learn(サイキットラーン)とは、Pythonのオープンソース機械学習ライブラリです。機能が充実している高品質ライブラリです。

基本説明

scikit-learnは、Python実装の機械学習ライブラリです。

機械学習アルゴリズムを幅広くサポートしています。分類回帰クラスタ分析(ニューラルネットワーク、サポートベクターマシン、ランダムフォレスト、k近傍法など)を手軽に実装できます。

プロトタイピングとして開発しやすく、大量データを扱わない場合には、そのまま実用できる機能を提供します。

TOPに戻る

主な特徴

数値計算ライブラリ連携

他のPython数値計算ライブラリ(NumPy、SciPy、Pandas、Matplotlibなど)と連携しやすいように設計されています。

「NumPyで作成した行列を機械学習の入力データとして利用する」などの連携を行えます。

「分類」

ラベルとデータを学習し、対象データのラベル予測を行なう機能です。対象オブジェクトがどのカテゴリに属しているかを識別します。

「スパム検出」「画像認識」などの用途に向いています。

サポートアルゴリズム
・SVM(サポートベクトルマシン、線形サポートベクトルマシン)
・K近傍法
・ランダムフォレスト

「回帰」

回帰データを学習して、実数値を予測する機能です。オブジェクトに関連付けられた連続値の属性を予測します。

「薬物応答予測」「株価予測」などの領域に向いています。

サポートアルゴリズム
・回帰
・ラッソ回帰
・リッジ回帰
・SVR

「クラスタリング」

似ているデータをまとめてデータ構造を発見する機能です。類似オブジェクトセットに対する自動的グループ化を行います。

「顧客セグメンテーション」「実験結果のグループ化」などの領域に向いています。

サポートアルゴリズム
・クラスタ分析(Clustering)
・K平均法(KMeans)
・混合ガウス分布(GMM)
・平均変位法(MeanShift)

「次元削減」

データの次元を削減して、「主成分分析」「要因発見」「考慮するランダム変数の数を減らす」などを行う機能です。次段階の分析手法の事前データ処理としても使われます。

サポートアルゴリズム
・主成分分析(PCA)
・非負値行列因子分解(NMF)

「モデル選択」

パラメータとモデルの比較/検証/選択を行なう機能です。

「パラメータ調整による精度向上」などに利用します。

依存するライブラリ

scikit-learnは、次のライブラリに依存します。線形代数演算の事実上の標準技術です。
・BLAS(線形代数ライブラリの標準仕様)
・LAPACK(BLASを基礎として高度な線形代数計算)

TOPに戻る

同様製品

同様な機能を提供する製品として、次のようなものがあります。

オープンソース製品:「Caffe」「Theano」「Chainer​」など。

TOPに戻る

導入事例

「Evernote」などへの導入実績があります。

TOPに戻る

ライセンス情報

scikit-learnのライセンスは「BSD license」です。このライセンスに従うことを条件として、ソースコードの改変と公開が許可されています。

TOPに戻る

ダウンロード

ダウンロードページ

TOPに戻る

参考元サイト

・scikit-learn
・Wikipedia →scikit-learn
・Python でデータサイエンス →scikit-learn で機械学習
・Qiita →scikit-learn から学ぶ機械学習の手法の概要
・アルゴリズム速報 →Scikit-learnで機械学習入門(使い方)
・たけぞう瀕死ブログ →scikit-learnによる機械学習入門

TOPに戻る

※定期的にメンテナンスを実施しておりますが、一部情報が古い場合がございます。ご了承ください。

scikit-learn最新TOPICS

最新情報はありません。

scikit-learn最新CLOSEUPコラム

  • オープソース書籍(サイド)

OSS×Cloud ACCESS RANKING

  • OSSNEWSに広告を掲載しませんか?

facebook

twitter