【OSS】ヤフー、分散表現学習時間短縮化技術「yskip」をオープンソース公開---自然言語処理学習時間を短縮化

【OSS】ヤフー、分散表現学習時間短縮化技術「yskip」をオープンソース公開---自然言語処理学習時間を短縮化

OSS×クラウド最新TOPICS 2019年4月23日 11:40

【OSS】ヤフー、分散表現学習時間短縮化技術「yskip」をオープンソース公開---自然言語処理学習時間を短縮化

ヤフー株式会社(Yahoo! JAPAN)は、AI/自然言語処理技術の1つである分散表現学習時間短縮化技術「yskip」をオープンソースソフトウェアとして公開した。

分散表現とは

分散表現とは、単語をベクトルで表現するための自然言語処理AI技術。

分散表現技術を用いると、大量のテキストデータからさまざまな単語の関係性を機械学習し、単語同士の意味の相違を機械的に推定できる。

「yskip」とは

「yskip」とは、ネガティブサンプリングによるインクリメンタルスキップグラムモデルのC++実装で、代表的分散表現学習法「SGNS(Skip-Gram model with Negative Sampling)」を拡張した技術。

増加し続けるビッグデータを追加分のみ機械学習することが可能で学習効率を高めることができる。全データ学習と比較した場合でも、学習時間を短縮化しつつ同等精度を維持できる。

→GitHub →yahoojapan/yskip

「yskip」のユースケース

Yahoo! JAPANでは、「ユーザーの興味関心情報」と「記事や広告」のマッチングの裏側の技術として活用している。

以上、下記URLからの要約
https://about.yahoo.co.jp/pr/release/2019/04/18a/

OSSNEWSに広告を掲載しませんか?

関連オープンソース

  • オープソース書籍(サイド)
  • OSSNEWSに広告を掲載しませんか?

facebook

twitter