【OSS】Python実装オープンソース機械学習ライブラリ「scikit-learn」---主要な機械学習アルゴリズム

【OSS】Python実装オープンソース機械学習ライブラリ「scikit-learn」---主要な機械学習アルゴリズム

OSS×クラウド最新TOPICS 2018年9月26日 13:38

【OSS】Python実装オープンソース機械学習ライブラリ「scikit-learn」---主要な機械学習アルゴリズム

Python実装オープンソース機械学習ライブラリ「scikit-learn」の概要と、「scikit-learnで利用できる主な機械学習アルゴリズム」について紹介。

scikit-learnとは

scikit-learnは、Pythonインターフェースを使用して、教師付き学習および教師なし学習などのアルゴリズムを提供する。

→OSSxCloudNews →オープンソースのAI・人工知能/scikit-learnとは

scikit-learnで利用できる主な機械学習アルゴリズム

①教師あり学習

概要

教師あり学習とは、正しい回答または分類でタグが付けられている「ラベル付きデータ」を使用して機械をトレーニングする手法。

ユースケース

ユースケースとしては「スパムメールや画像認識などの分類」によく使用される。

②教師なし学習

概要

教師なし学習では、ラベルがついていないトレーニングデータを使用してトレーニングを行う。そのため、アルゴリズム自体は、類似点/パターン/相違点を認識しようとする。

ユースケース

・クラスタリング---顧客または購入者を購入パターンに基づいて分類
・可視化と次元削減---主成分分析、カーネルPCA
・関連ルール学習---特定の認識可能な行動パターンに基づいてルールを設定 など

③半教師あり学習

半教師あり学習とは、部分的にラベル付けされたデータやラベルのないデータを使用してトレーニングを行う手法。

④強化学習

強化学習とは、アクションを実行して結果を見ることによって、環境内でどのように行動するかを学習する手法。

既存例としては、GoogleのDeepMindやAlphaGoなどがある。

⑤バッチ学習/オンライン学習

バッチ学習は、システムウェイトを一定に保ちながら、入力内の各サンプルに関連するエラーを計算する。

オンライン学習では、常にその重みを更新しているのため、誤差計算は各入力サンプルに対して異なる重みを使用する。

以上、下記URLからの要約
https://opensourceforu.com/2018/09/machine-learning-building-a-predictive-model-with-scikit-learn/

クリエイティブ・コモンズ・ライセンス
この作品は クリエイティブ・コモンズ 表示 - 非営利 4.0 国際 ライセンスの下に提供されています。

OSSNEWSに広告を掲載しませんか?

最新TOPICS

【講演資料の公開】9/27開催「ベトナムでのAI(人工知能)開発って、ぶっちゃけどうなの?」(10月30日 10:55)

2019年9月27日(金)15:30~17:00 AP品川アネックス にて 「ベトナムでのAI(人工知能)開発って、ぶっちゃけどうなの?」 と題したセミナーが開催されました。 質疑応答時は、スクリーンに質問内容が投影され、ゲストの方にとっては質問しやすかったようで多くの質問が挙がっていました。登壇者とゲストの方との一体感を感じるセミナーとなりました。 ご参加頂いた皆様、あり...

関連オープンソース

scikit-learn(サイキットラーン)

  • AI・人工知能

scikit-learn(サイキットラーン)とは、Pythonのオープンソース機械学習ライブラリです。機械学習アルゴリズムを幅広くサポートしており、「分類回帰クラスタ分析」「ニューラルネットワーク」「サポートベクターマシン」「ランダムフォレスト」「k近傍法」などを手軽に実装できます。

Chainer(チェイナー)

  • AI・人工知能

Chainer(チェイナー)とは、日本製の深層学習フレームワークです。ニューラルネットワークを誤差伝播で学習するライブラリで、Pythonで柔軟に記述し学習させることができます。特徴として「柔軟性」「直感的」「高機能」の3つを掲げています。

Caffe(カフェ)

  • AI・人工知能

Caffe(カフェ)とは、オープンソースのディープラーニングライブラリです。画像認識に特化しており、「高速動作」「GPU対応」「洗練されたアーキテクチャ/ソースコード」「開発コミュニティが活発」などの特徴があります。C++/Python/MATLABなどで使用できます。

TensorFlow(テンソルフロー)

  • AI・人工知能

TensorFlow(テンソルフロー)とは、Googleの機械学習/ディープラーニング/多層ニューラルネットワークライブラリです。データフローグラフを使用したライブラリで複雑なネットワークを分かりやすく記述できます。高い汎用性により研究レベルから実プロダクトにまで活用できます。

Pylearn2(パイラーンツー)

  • AI・人工知能

Pylearn2(パイラーンツー)とは、数値計算ライブラリ「Theano」ベースのオープンソースディープラーニングライブラリです。

MXNet(エムエックスネット)

  • AI・人工知能

MXNet(エムエックスネット)とは、「効率」と「柔軟性」を両立したディープラーニングフレームワークです。AWSが公式サポートを表明したことで大きな注目を集めています。

Theano(テアノ)

  • AI・人工知能

Theano(テアノ)とは、Python用数値計算ライブラリです。多次元配列を効率的に使用する数式について定義/最適化/評価でき、ディープラーニング計算処理によく利用されます。

H2O(エイチツーオー)

  • AI・人工知能

H2O(エイチツーオー)とは、オープンソースの分散型インメモリマシン機械学習プラットフォームです。

Eclipse Deeplearning4j(イクリプスディープラーニングフォージェイ)

  • AI・人工知能

Eclipse Deeplearning4j(イクリプスディープラーニングフォージェイ)とは分散型深層学習ライブラリです。「Java」「JVM(Java仮想マシン)」「各種アルゴリズム」をサポートします。

Keras(ケラス)

  • AI・人工知能

Keras(ケラス)とは、Python実装の高水準ニューラルネットワークライブラリです。「TensorFlow」「Microsoft Cognitive Toolkit」「Theano」上で実行できます。

Torch(トーチ)

  • AI・人工知能

Torch(トーチ)とは、「機械学習ライブラリ」「科学計算フレームワーク」です。GPUを活用する機械学習アルゴリズムを幅広くサポートしています。

DSSTNE(デスティニー)

  • AI・人工知能

DSSTNE(デスティニー)。ディープラーニングライブラリです。Amazonがオープンソース公開したもので、スパース(疎)データに強いという特徴があります。

Microsoft Cognitive Toolkit(マイクロソフトコグニティブツールキット)

  • AI・人工知能

Microsoft Cognitive Toolkit(マイクロソフトコグニティブツールキット)。AI技術を利用したディープラーニング(深層学習)ツールキットです。旧称「CNTK」から改名されました。

  • Zabbixカンファレンス2019
  • OSSNEWSに広告を掲載しませんか?

facebook

twitter

facebook

twitter