機械学習アルゴリズム「RandomForest」の概要について紹介します。
「RandomForest」とは、機械学習方法の1手法で、「分類」「回帰」「クラスタリング」などに用いられます。
仕組みとしては「決定木」の1つで、集団学習アルゴリズムです。
大量の決定木を生成して、それぞれの決定木が出した答えの多数決を取り、最も数が多かったクラスに分類します。
大量の決定木を使用するため、「木が集まっている森(フォレスト、Forest)」というイメージになります。
・学習/評価が高速
・並列化可能(決定木の学習はそれぞれ完全に独立)
・多クラス識別が容易
・実装が比較的容易
・説明変数が多数で欠損していても対応可能(欠損値を許容)
・説明変数重要度(寄与度)を算出できる
・特徴のスケールや距離尺度に影響を受けない
・クロスバリデーションのような評価が可能(Out of Bagエラー計算)
・説明変数の中で「意味のある変数」が「ノイズ変数」よりも極端に少ない場合にはうまく働かない
「RandomForest」の基本である「決定木」の解説をベースにして、「RandomForest」について解説されています。
・決定木とは
・ランダムフォレストとは
・やってみる(sklearnでの決定木)
・データ用意
・決定木をやってみる
・ランダムフォレストをやってみる
・ランダムフォレストで回帰をやってみる
・sklearnで実行
「RandomForest」について実務的な視点から解説されています。
・なぜRandomForestは精度が高くなるのか?
・baggingとの違いは何か?
・パラメータチューニングはどうすればよいか?
・実装
→shakezoの日記 →実務でRandomForestを使ったときに聞かれたこと
「RandomForest」をHiveで実装する例が解説されています。
1. RandomForestとは?
・まずは決定木から
・どうやって「条件」を取り出すか
・RandomForestは木が森になっただけです。
2. RandomForestで毒キノコ推定モデルを作る
・使うデータはmushroom
・Hiveで前処理
・ついにRandomForest!
→アドテクるびす界 →【Hivemall入門】RandomForestで毒キノコ推定モデルを作る
「RandomForest」の派生アルゴリズムと活用例について解説されています。
・はじめに
・Random Forest
・基本的なアルゴリズム
・派生アルゴリズム
・Extremely Randomized Trees
・Alternating Decision Forests
・Random Ferns
・色々な使い方
・Depth 情報を使った姿勢推定
・画像の領域セグメンテーション
・キーポイントマッチング
・通常の単一カメラでの姿勢推定
Python実装オープンソース機械学習ライブラリ「scikit-learn」の概要と、「scikit-learnで利用できる主な機械学習アルゴリズム」について紹介。 scikit-learnとは scikit-learnは、Pythonインターフェースを使用して、教師付き学習および教師なし学習などのアルゴリズム...
OSS×Cloud ACCESS RANKING