【OSS化】ヤフー、ビッグデータ分析用高次元データ高速検索技術「NGT(Neighborhood Graph and Tree for Indexing)」をオープンソース公開---特許実施権も無償で提供

【OSS化】ヤフー、ビッグデータ分析用高次元データ高速検索技術「NGT(Neighborhood Graph and Tree for Indexing)」をオープンソース公開---特許実施権も無償で提供

OSS×クラウド最新TOPICS 2016年11月25日 10:03

【OSS化】ヤフー、ビッグデータ分析用高次元データ高速検索技術「NGT(Neighborhood Graph and Tree for Indexing)」をオープンソース公開---特許実施権も無償で提供

ヤフー株式会社は、11月24日、
ビッグデータ分析用高次元データ高速検索技術「NGT(Neighborhood Graph and Tree for Indexing)」をオープンソース公開した。

【NGTとは】
・複数の特徴を持つ高次元データ(テキスト/画像/商品/ユーザーデータなど)を高速に検索/特定できる技術
・ビッグデータの分析の高速化を実現

【ポイント】
・同技術に関係する特許の実施権も無償で提供

(出所:http://cloud.watch.impress.co.jp/docs/news/1031517.html

OSSNEWSに広告を掲載しませんか?

最新TOPICS

【PICKUP】HPE、メモリ主導型アーキテクチャ実証実験に成功---160TBの単一メモリ空間、将来的には「ヨタバイト級」単一メモリプール実現の可能性(05月22日 20:03)

米ヒューレット・パッカード・エンタープライズ(HPE)は、5月16日(現地時間)、 「世界最大の単一メモリ空間を持つコンピューターの実証実験」に成功したと発表した。 【ポイント】 ・「プロセッサ中心型アーキテクチャ」からの「メモリ主導型アーキテクチャ」の実用化を目指している ・実証実験機「The Machine」 ・160TBの単一メモリ空間 ・「ヨタバイト級」単一メモリプールの実...

関連オープンソース

Schema Registry(スキーマ レジストリ)

  • ビッグデータ処理ツール

Schema Registry(スキーマ レジストリ)とは、メッセージングシステム「Apache Kafka」ベースのストリームデータ基盤「Confluent Platform」の1コンポーネントです。一元的なスキーマ管理機能を提供します。

Apache Kafka(アパッチ カフカ)

  • ビッグデータ処理ツール

Apache Kafka(アパッチ カフカ)とは、分散メッセージングシステムです。「Pull型」「高スループット」などの特徴があり、ストリーミングデータパイプライン構築に使用できます。

NGT(エヌジーティー)

  • ビッグデータ処理ツール

NGT(Neighborhood Graph and Tree for Indexing)とは、高次元ベクトルデータ高速検索技術です。ビッグデータ分析/ディープラーニング領域に活用できる技術として注目されています。

Apache NiFi(アパッチナイファイ)

  • BIツール

Apache NiFi(アパッチナイファイ)。データフローオーケストレーションツールです。Webインタフェースでシステム間のデータフロー自動化定義が可能です。IoTデータフローを見据えた双方向性が特徴です。

Apache Flink(アパッチフリンク)

  • ストリームデータ処理

Apache Flink(アパッチフリンク)。分散ストリーム処理プラットフォームです。バッチ処理にも対応し、耐障害性/拡張性を備えたストリーム処理基盤です。

Apache Nutch(アパッチナッチ)

  • ビッグデータ処理ツール

Apache Nutch(アパッチナッチ)。オープンソースのWebクローラフレームワークです。Apache Hadoopによる拡張性が特徴です。

RapidMiner(ラピッドマイナー)

  • BIツール

RapidMiner(ラピッドマイナー)。オープンソースのデータ分析プラットフォームです。機械学習、データマイニング、テキストマイニング、特徴選択、予測分析、経営分析などを行います。プログラミングなしでデータ分析を行える点が特徴です。

Apache Drill(アパッチドリル)

  • ビッグデータ処理ツール

Apache Drill(アパッチドリル)。ビッグデータに対応するスキーマフリーSQLクエリエンジンです。構造化データ/非構造化データなどのさまざまなデータソースに対して、直接SQLクエリを実行して結果を得ることができます。

Norikra(ノリクラ)

  • ストリームデータ処理

Norikra(ノリクラ)。ストリームデータ処理エンジンです。リアルタイムイベントストリームデータに対して、SQLライク言語でスキーマレスなデータ処理が可能です。手軽に利用できる点が特徴です。

Apache Lucene(アパッチルシーン)

  • 検索エンジン

Apache Lucene(アパッチルシーン)。高性能/高機能/極めてスケーラブルなオープンソース全文検索エンジンライブラリです。

Apache ManifoldCF(アパッチマニフォールドシーエフ)

  • ビッグデータ処理ツール

Apache ManifoldCF(アパッチマニフォールドシーエフ)。オープンソースクローラフレームワークです。インターネット上やイントラネット内のさまざまなサーバに保管されているドキュメントコンテンツ(Webページ/文書ファイル/DBデータなど)を収集し、それを検索エンジンに送ります。

Kibana(キバナ)

  • BIツール

Kibana(キバナ)。Elastic社が提供するログデータ解析/可視化ツールです。基本的に、リアルタイム検索エンジン「Elasticsearch」とセットで使われます。

Elasticsearch(エラスティックサーチ)

  • 検索エンジン

Elasticsearch(エラスティックサーチ)。Elastic社が提供する「Lucene」ベースのオープンソース全文検索エンジンです。マルチテナント、スキーマレスでクラウドに最適化されています。

Apache Storm(アパッチストーム)

  • ストリームデータ処理

Apache Storm(アパッチストーム)。オープンソースで耐障害性に優れた高速分散処理型ニアリアルタイムビッグデータ処理フレームワークです。

Apache Spark(アパッチスパーク)

  • ビッグデータ処理ツール

Apache Spark(アパッチ スパーク)。オープンソースのインメモリ高速分散処理プラットフォームです。「Apache Hadoop」の不得意な部分に改善を加え、ビッグデータに対するバッチ処理/リアルタイム処理/インタラクティブ分析などを高速に実行できます。

Apache Hadoop(アパッチハドゥープ)

  • ビッグデータ処理ツール

Apache Hadoop(アパッチ ハドゥープ)。オープンソース大規模データ分散処理フレームワークです。大規模データを効率的に分散処理/管理できます。注目を集めている技術の1つです。

Apache Solr(アパッチソーラー)

  • 検索エンジン

Apache Solr(アパッチソーラー)。Javaベースのオープンソース高機能全文検索エンジン。

Pentaho(ペンタホ)

  • BIツール

Pentaho(ペンタホ)。BI(Business Intelligence)に必要なすべての機能が用意されている、プロフェッショナル向けのオープンソースBIスイート製品です。

OpenOLAP(オープンオーラップ)

  • BIツール

OpenOLAP(オープンオーラップ)。PostgreSQLを利用した、多次元データベース(OLAP)システム

Jaspersoft(ジャスパーソフト)

  • BIツール

Jaspersoft(ジャスパーソフト)。PDFやHTMLなど様々な出力形式の帳票を作成することができるライブラリ

Eclipse BIRT(エクリプス バート)

  • BIツール

Eclipse BIRT(エクリプス バート)。BIRTとは、Business Intelligence and Reportting Toolsの頭文字。Eclipse上で利用できるレポート開発環境

  • オープソース書籍(サイド)

OSS×Cloud ACCESS RANKING

  • OSSNEWSに広告を掲載しませんか?

facebook

twitter

facebook

twitter