OSS×クラウド最新TOPICS 2019年8月19日 10:30
Googleは、Androidの音声認識トランスクリプションツール「Live Transcribe」用の音声エンジンをオープンソース化した。
Googleは2019年2月に、聴覚障害者や難聴者向けのリアルタイムキャプションを提供するAndroidアプリケーション「Live Transcribe」をリリースした。
このツールは、機械学習アルゴリズムを使用しており、70以上の言語と方言でリアルタイムの話し言葉をキャプションできる。
スマートフォンのマイク(または外部マイク)を使用して機能し、Google Cloud Speech APIを利用している。
→android.com →accessibility →live-transcribe
今回オープンソース化されたライブラリは、実稼働アプリケーションの「Live Transcribe」で実行されているライブラリとほぼ同じものが提供されている。
リポジトリには、Live Transcribeで使用されるGoogleのCloud Speech APIと通信するためのAndroidクライアントライブラリが含まれている。
→GitHub →google/live-transcribe-speech-engine
以上、下記URLからの要約
https://venturebeat.com/2019/08/16/google-open-sources-live-transcribes-speech-engine/
Manifoldとは Manifoldは、エンジニアや科学者が、MLデータスライスとモデル全体のパフォーマンス問題を特定し、データのサブセット間の機能分布の違いを明らかにすることで根本原因を診断するのに役立つデバッグツール。 「Apache License 2.0」で提供されている。
OSS×Cloud ACCESS RANKING