OSS×クラウド最新TOPICS 2018年9月26日 13:38
Python実装オープンソース機械学習ライブラリ「scikit-learn」の概要と、「scikit-learnで利用できる主な機械学習アルゴリズム」について紹介。
scikit-learnは、Pythonインターフェースを使用して、教師付き学習および教師なし学習などのアルゴリズムを提供する。
→OSSxCloudNews →オープンソースのAI・人工知能/scikit-learnとは
教師あり学習とは、正しい回答または分類でタグが付けられている「ラベル付きデータ」を使用して機械をトレーニングする手法。
ユースケースとしては「スパムメールや画像認識などの分類」によく使用される。
教師なし学習では、ラベルがついていないトレーニングデータを使用してトレーニングを行う。そのため、アルゴリズム自体は、類似点/パターン/相違点を認識しようとする。
・クラスタリング---顧客または購入者を購入パターンに基づいて分類
・可視化と次元削減---主成分分析、カーネルPCA
・関連ルール学習---特定の認識可能な行動パターンに基づいてルールを設定 など
半教師あり学習とは、部分的にラベル付けされたデータやラベルのないデータを使用してトレーニングを行う手法。
強化学習とは、アクションを実行して結果を見ることによって、環境内でどのように行動するかを学習する手法。
既存例としては、GoogleのDeepMindやAlphaGoなどがある。
バッチ学習は、システムウェイトを一定に保ちながら、入力内の各サンプルに関連するエラーを計算する。
オンライン学習では、常にその重みを更新しているのため、誤差計算は各入力サンプルに対して異なる重みを使用する。
以上、下記URLからの要約
https://opensourceforu.com/2018/09/machine-learning-building-a-predictive-model-with-scikit-learn/
この作品は クリエイティブ・コモンズ 表示 - 非営利 4.0 国際 ライセンスの下に提供されています。
Manifoldとは Manifoldは、エンジニアや科学者が、MLデータスライスとモデル全体のパフォーマンス問題を特定し、データのサブセット間の機能分布の違いを明らかにすることで根本原因を診断するのに役立つデバッグツール。 「Apache License 2.0」で提供されている。
OSS×Cloud ACCESS RANKING