概要
Google Cloud Vision APIとは、Google Cloud Platform(GCP)が提供する画像認識サービスです。機械学習モデルを利用して、対象画像を分析し、さまざまな情報を取得できます。
基本情報
プラットフォーム | Google Cloud Platform |
クラウドサービス名 | Google Cloud Vision API |
読み方 | グーグル クラウドビジョンエーピーアイ |
略称 | --- |
基本説明
Google Cloud Vision APIは、REST APIでアクセスして、画像分析情報を取得できるサービスです。
分析対象となる画像データをREST APIでクラウドに送ると、分析結果情報(JSON)を1秒程度で返します。
機械学習に関する知識は必要なく、簡単に画像解析を行えます。
多くのユーザーに使用されるほど、「Vision API」の認識精度は高まっていっています。
主な特徴
物体検知
画像内のさまざまな物体を検出します。
「花」「動物」「乗り物」などの物体カテゴリに分類して、ラベルを返します。
顔検出(感情分析)
画像に含まれる複数の人物の顔を検出します。
「目鼻口の座標位置」「3次元的な顔の向き」などを取得できます。
「喜び」「悲しみ」「怒り」など、人物の顔に表れる感情も分析できます。
テキスト抽出
Google Cloud Vision APIは、光学式文字認識(OCR)機能を備えており、画像内に存在するテキストを検出できます。
さまざまな言語に対応しており、言語種類も自動判別されます。
ロゴ検出
画像に含まれる一般的なロゴを検知できます。
・製品ロゴ
・企業ロゴ
・ブランドマーク など
権利関係絡みでの画像チェックなどへの活用が可能です。
ランドマーク検出
画像に含まれるランドマークを検出できます。
・自然のランドマーク(富士山 など)
・人工建造物(特定のビル など)
そのランドマークの地理的位置情報も返されます。
不適切コンテンツ検出
Googleの「セーフサーチ機能」の活用により、さまざまなタイプの不適切コンテンツの検出を行えます。
・アダルトコンテンツの要素
・バイオレンスコンテンツの要素 など
アクセス方法
Google Cloud Vision APIを利用するために、2つの方法が用意されています。
1.直接REST APIで問い合わせを行う
2.「Google Cloud SDK」を通して問い合わせを行う
クラウドストレージサービス「Google Cloud Storage」との連携も可能です。
同様サービス
同様なサービスとして、次のようなものがあります。
AWS「Amazon Rekognition」、Azure「Computer Vision API」など
オフィシャルサイト
オフィシャルサイト
→Google Cloud Platform →Google Cloud Vision API
料金情報
→Google Cloud Platform →Google Cloud Vision API →料金
参考元サイト
・Google Cloud Platform →Google Cloud Vision API
・Qiita →Google Cloud Platform Advent Calendar 2015 3日目 →Cloud Vision APIの凄さを伝えるべくRasPi botとビデオを作った話
・Developers.IO →Google Cloud Vision APIを使ってみた
・Syncer →Cloud Vision APIの使い方まとめ (サンプルコード付き)
※定期的にメンテナンスを実施しておりますが、一部情報が古い場合がございます。ご了承ください。