scikit-learn(サイキットラーン)とは、Pythonのオープンソース機械学習ライブラリです。機械学習アルゴリズムを幅広くサポートしており、「分類回帰クラスタ分析」「ニューラルネットワーク」「サポートベクターマシン」「ランダムフォレスト」「k近傍法」などを手軽に実装できます。

オープンソースのAI・人工知能/scikit-learnとは

scikit-learn(サイキットラーン)とは、Pythonのオープンソース機械学習ライブラリです。機械学習アルゴリズムを幅広くサポートしており、「分類回帰クラスタ分析」「ニューラルネットワーク」「サポートベクターマシン」「ランダムフォレスト」「k近傍法」などを手軽に実装できます。

■関連する比較ページ

「scikit-learn」基本情報

■概要

scikit-learn(サイキットラーン)とは、Pythonのオープンソース機械学習ライブラリです。

■基本説明

scikit-learnは、Python実装の機械学習ライブラリです。

機械学習アルゴリズムを幅広くサポートしています。分類回帰クラスタ分析(ニューラルネットワーク、サポートベクターマシン、ランダムフォレスト、k近傍法など)を手軽に実装できます。

プロトタイピングとして開発しやすく、大量データを扱わない場合には、そのまま実用できる機能を提供します。

■オフィシャルサイト情報

オフィシャルサイト

→scikit-learn

ライセンス情報

scikit-learnのライセンスは「New BSD License」です。

詳細について、こちらを参照ください。
→GitHub →scikit-learn/scikit-learn →COPYING

ダウンロード

→scikit-learn →Installing scikit-learn

導入事例

「Evernote」などへの導入実績があります。

→scikit-learn →Who is using scikit-learn?

■同様製品

同様な機能を提供する製品として、次のようなものがあります。

オープンソース製品:「Caffe」「Theano」「Chainer​」など。

「scikit-learn」の主な特徴

■数値計算ライブラリ連携

他のPython数値計算ライブラリ(NumPy、SciPy、Pandas、Matplotlibなど)と連携しやすいように設計されています。

「NumPyで作成した行列を機械学習の入力データとして利用する」などの連携を行えます。

■依存するライブラリ

scikit-learnは、次のライブラリに依存します。線形代数演算の事実上の標準技術です。
・BLAS(線形代数ライブラリの標準仕様)
・LAPACK(BLASを基礎として高度な線形代数計算)

「scikit-learn」の主な機能

■分類機能

ラベルとデータを学習し、対象データのラベル予測を行なう機能です。対象オブジェクトがどのカテゴリに属しているかを識別します。

「スパム検出」「画像認識」などの用途に向いています。

サポートアルゴリズム

・SVM(サポートベクトルマシン、線形サポートベクトルマシン)
・K近傍法
・ランダムフォレスト

■回帰機能

回帰データを学習して、実数値を予測する機能です。オブジェクトに関連付けられた連続値の属性を予測します。

「薬物応答予測」「株価予測」などの領域に向いています。

サポートアルゴリズム

・回帰
・ラッソ回帰
・リッジ回帰
・SVR

■クラスタリング機能

似ているデータをまとめてデータ構造を発見する機能です。類似オブジェクトセットに対する自動的グループ化を行います。

「顧客セグメンテーション」「実験結果のグループ化」などの領域に向いています。

サポートアルゴリズム

・クラスタ分析(Clustering)
・K平均法(KMeans)
・混合ガウス分布(GMM)
・平均変位法(MeanShift)

■次元削減機能

データの次元を削減して、「主成分分析」「要因発見」「考慮するランダム変数の数を減らす」などを行う機能です。次段階の分析手法の事前データ処理としても使われます。

サポートアルゴリズム

・主成分分析(PCA)
・非負値行列因子分解(NMF)

■モデル選択機能

パラメータとモデルの比較/検証/選択を行なう機能です。

「パラメータ調整による精度向上」などに利用します。

scikit-learn最新TOPICS

【OSS】Python実装オープンソース機械学習ライブラリ「scikit-learn」---主要な機械学習アルゴリズム(2018年09月26日 13:38)

Python実装オープンソース機械学習ライブラリ「scikit-learn」の概要と、「scikit-learnで利用できる主な機械学習アルゴリズム」について紹介。 scikit-learnとは scikit-learnは、Pythonインターフェースを使用して、教師付き学習および教師なし学習などのアルゴリズム...

scikit-learn最新CLOSEUPコラム

イベント情報

セミナー講演資料

無料資料プレゼント

2021/03/04 セキュリティDAYS Keyspider資料

講演資料を見るには、 プライバシーポリシーに同意して、送付先メールアドレスをご入力しご請求ください。

またご入力いただきました情報は、当該資料の作成・提供企業とも共有させていただき、当社及び各社のサービス、製品、セミナー、イベントなどのご案内に使用させていただきます。

本資料を見るには次の画面でアンケートに回答していただく必要があります。



セミナー講演資料公開中

注目のDB技術「HTAP」とは? ~手軽に、かつ高速に、リアルタイム分析を実現する方法~

ビッグデータ処理のデータベースとして MySQL HeatWave が最適な理由 〜AWS Aurora/Redshift、GCP BigQuery との性能&コスト比較〜

上からも下からもプレッシャー中間管理職の「悩み」をデータの視点で解決 〜タイムリーなデータ活用、円滑な状況共有を導く分かりやすいデータストーリーとは〜

  • オープソース書籍(サイド)
  • OSSNEWSに広告を掲載しませんか?

facebook

twitter