ざっくりわかる「機械学習」---第1回 機械学習とは(入門編) | 第一線で活躍するオープンソースエキスパートが綴るスペシャルコラム。

ざっくりわかる「機械学習」---第1回 機械学習とは(入門編)

ざっくりわかる「機械学習」シリーズ。第1回は『機械学習とは(入門編)』です。

[2016年12月21日 ]

ざっくりわかる「機械学習」シリーズ。
→目次ページ

第1回は『機械学習とは(入門編)』です。

機械学習とは

「機械学習」という言葉は、さまざまな観点から多種多様な説明がなされています。

ざっくりまとめると・・・

機械学習とは「コンピュータ(ソフトウェア)がアルゴリズムを使用して、大量のデータから自動的に反復的に学習し、人間にとっての正解となりうる回答を導き出す仕組み」とまとめることもできるのではないでしょうか。

自律的洞察

機械学習での反復的学習において、新しいデータを学習処理するたびに、アルゴリズムが自律的に適応して発展していきます。

学習を繰り返すほど、ルール/パターン/基準などを抽出し、精度の高い回答を出せるようになります。

近年の発展

機械学習技術は、近年、急激に発達しています。

1950年代に第1次人工知能ブームがあり、1980年代に第2次人工知能ブームがありました。そして、2000年代になって「ディープラーニング(深層学習)」技術が注目されるようになった結果、近年の機械学習ブームにつながっているとされています。

考えられる主な要因

・クラウドの発達により、高度なコンピュータ処理能力を安価で調達できるようになった
・データストレージコストが下がった
・ビッグデータを容易に扱えるようになった
・ビッグデータを利用したアルゴリズム研究が進んだ
・さまざまな機械学習ソフトウェアがオープンソース公開され、活用される

機械学習が注目されている理由

考えられる主な要因

・モデルが学習した結果を使用して、信頼性/再現性のある意思決定もたらす
・正確なモデルを構築することで、企業/組織は収益実現の機会を特定できる(未知のリスクを回避できる)
・人間が介入しない意思決定の的確性を高めることができる
・予測分析モデル構築の自動化につながり、データサイエンティストの人材不足を補うものになる

主な機械学習の手法

機械学習のためには、適切なアルゴリズムで、繰り返し反復的に学習させることが不可欠です。

主な学習方法として3種類紹介します。

(1)教師あり学習

「教師あり学習」では、手本となるデータセット(一連の入力とそれらに対応する正しい出力が決定されているデータ)を使ってトレーニングを実行します。「このデータを受け取ったら、このデータを回答しなさい」という大量のデータセットでトレーニングします。

手本データセットには存在しないデータが入力された場合に、正しい回答を出せるように訓練します。

「教師あり学習」は、過去のデータから将来発生しそうな事象予測用途などに使われます。「クレジットカード取引の不正検知予測」「保険金請求を行いそうな保険契約者を特定」などのケースが想定されます。

(2)教師なし学習

「教師なし学習」は、手本となるデータセットなしで、入力データのみが与えられます。

正しい出力が与えられないため、何らかの基準を設けて、最適となる出力の割り当てを求めます。アルゴリズム自身が学習して、分類するためのモデルを算出し、データの意味を突き止めなければなりません。

用途としては、「Webデータからのコンバージョン分析」「自然言語処理」「テキストトピックのセグメンテーション」「商品レコメンド」「データ外れ値の特定」などが想定されます。

(3)半教師あり学習

「半教師あり学習」は「教師あり学習」と「教師なし学習」をミックスさせた学習法です。「正解を含んだ訓練データ」と「正解を含まない訓練データ」の両方を使用してトレーニングを行います。

用途としては「Webカメラの顔認識」などが想定されます。

ざっくりわかる「機械学習」シリーズ。
→目次ページ

OSSNEWSに広告を掲載しませんか?

著者プロフィール

オープンソース活用研究所 所長 寺田雄一

1993年、株式会社野村総合研究所(NRI)入社。
インフラ系エンジニア、ITアーキテクトとして、証券会社基幹系システム、証券オンライントレードシステム、損保代理店システム、大手流通業基幹系システムなど、大規模システムのアーキテクチャ設計、基盤構築に従事。
2003年、NRI社内に、オープンソースの専門組織の設立を企画、10月に日本初となるオープンソース・ソリューションセンター設立。
2006年、社内ベンチャー制度にて、オープンソース・ワンストップサービス 「OpenStandia(オープンスタンディア)」事業を開始。オープンソースを活用した、企業情報ポータル、情報分析、シングルサインオン、統合ID管理、ドキュメント管理、統合業務システム(ERP)などの事業を次々と展開。
オープンソースビジネス推進協議会(OBCI),OpenAMコンソーシアムなどの業界団体も設立。同会の理事、会長や、NPO法人日本ADempiereの理事などを歴任。
2013年、NRIを退社し、株式会社オープンソース活用研究所を設立。

最新TOPICS

【OSS】Pythonが機械学習に適している理由6選(2018年10月17日 10:22)

機械学習にPythonを使うべき理由について解説。 機械学習のためのオープンソースプログラミング言語「Python」 Pythonは複雑な操作を実行するために広く使用されているオープンソースのプログラミング言語の1つ。 「シンプルに処理を記述できる」「機械学習用ライブラリ(ツール群)が充実」など...

関連オープンソース

Eclipse Deeplearning4j(イクリプスディープラーニングフォージェイ)

  • AI・人工知能

Eclipse Deeplearning4j(イクリプスディープラーニングフォージェイ)とは分散型深層学習ライブラリです。「Java」「JVM(Java仮想マシン)」「各種アルゴリズム」をサポートします。

Keras(ケラス)

  • AI・人工知能

Keras(ケラス)とは、Python実装の高水準ニューラルネットワークライブラリです。「TensorFlow」「Microsoft Cognitive Toolkit」「Theano」上で実行できます。

Torch(トーチ)

  • AI・人工知能

Torch(トーチ)とは、「機械学習ライブラリ」「科学計算フレームワーク」です。GPUを活用する機械学習アルゴリズムを幅広くサポートしています。

Pylearn2(パイラーンツー)

  • AI・人工知能

Pylearn2(パイラーンツー)とは、数値計算ライブラリ「Theano」ベースのオープンソースディープラーニングライブラリです。

scikit-learn(サイキットラーン)

  • AI・人工知能

scikit-learn(サイキットラーン)とは、Pythonのオープンソース機械学習ライブラリです。機能が充実している高品質ライブラリです。

MXNet(エムエックスネット)

  • AI・人工知能

MXNet(エムエックスネット)とは、「効率」と「柔軟性」を両立したディープラーニングフレームワークです。AWSが公式サポートを表明したことで大きな注目を集めています。

Theano(テアノ)

  • AI・人工知能

Theano(テアノ)とは、Python用数値計算ライブラリです。多次元配列を効率的に使用する数式について定義/最適化/評価でき、ディープラーニング計算処理によく利用されます。

DSSTNE(デスティニー)

  • AI・人工知能

DSSTNE(デスティニー)。ディープラーニングライブラリです。Amazonがオープンソース公開したもので、スパース(疎)データに強いという特徴があります。

Caffe(カフェ)

  • AI・人工知能

Caffe(カフェ)。オープンソースのディープラーニングライブラリです。画像認識に特化しており、高速処理が可能です。

Chainer(チェイナー)

  • AI・人工知能

Chainer(チェイナー)。日本製の深層学習フレームワークです。ニューラルネットワークをPythonで柔軟に記述し、学習させることができます。

TensorFlow(テンソルフロー)

  • AI・人工知能

TensorFlow(テンソルフロー)。Googleの機械学習/ディープラーニング/多層ニューラルネットワークライブラリです。データフローグラフを使用したライブラリで、複雑なネットワークを分かりやすく記述できます。

Microsoft Cognitive Toolkit(マイクロソフトコグニティブツールキット)

  • AI・人工知能

Microsoft Cognitive Toolkit(マイクロソフトコグニティブツールキット)。AI技術を利用したディープラーニング(深層学習)ツールキットです。旧称「CNTK」から改名されました。

関連記事

無料資料プレゼント

第2回「多要素認証の種類と方法」

講演資料を見るには、 プライバシーポリシーに同意して、送付先メールアドレスをご入力しご請求ください。

またご入力いただきました情報は、当該資料の作成・提供企業とも共有させていただき、当社及び各社のサービス、製品、セミナー、イベントなどのご案内に使用させていただきます。

本資料を見るには次の画面でアンケートに回答していただく必要があります。



  • オープソース書籍(サイド)

facebook

twitter