NGTは「近似k最近傍探索(k-Nearest Neighbor Search)」するためのソフトウエアです。
任意の密ベクトルに対して事前に登録した同次元のベクトルから最も距離が近いベクトルの上位数件(k件)を高速検索します。
「グラフ」と「ツリー」を組み合わせたインデックスを用いる近傍検索手法で、代表的なツリー型やハッシュ型のインデックスよりも高速検索を実現できることを実験で確認されています。
NGTは以下の言語をサポートしています。
・Python
・Go
・C
・C++
NGTでは、Python用インターフェースを提供します。Python用機械学習ライブラリとNGTを組み合わせて利用できます。
「Pythonでインデックス作成まで行い、NGTで密ベクトル検索を行う」「機械学習の学習時バリデーション」「RNNで作成された中間表現の分析」などのように連携して活用できます。
→Yahoo! JAPAN Tech Blog →高次元ベクトルデータ検索技術「NGT」のpythonライブラリ公開のお知らせ
OSS×Cloud ACCESS RANKING