Apache Solr(アパッチソーラー)。Javaベースのオープンソース高機能全文検索エンジン。

オープンソースの検索エンジン/Apache Solrとは

Apache Solr(アパッチソーラー)。Javaベースのオープンソース高機能全文検索エンジン。

基本情報

概要

Apache Solr(アパッチソーラー)は、Javaベースのオープンソース全文検索エンジンです。

「ローカルにある文書ファイルの中から、キーワードを含む文書を検索する」というのが基本的な機能となります。

他のシステムやツールと組み合わせることで、GoogleのようなWeb検索も行えるようにすることもできます。

「Apache Solr」は、Apacheソフトウェア財団で開発されている全文検索エンジン「Lucene」プロジェクトのサブプロジェクトとして開発されています。「Lucene」をベースにして、管理画面やキャッシュ機構などが搭載されて、機能強化されています。

開発コミュニティが活発に活動していて、日本語対応も、積極的に行われています。

基本的には、英語圏での製品なので、デフォルトのままでは日本語検索の精度は、あまり高くありません。そこで、「Sen」「Gosen」「Kuromoji」などの日本語トークナイザ(形態素解析器)の追加設定をすることで、日本語検索の精度を高めることができます。

TOPに戻る

主な機能

【インデックスレプリケーション】
あるSolrサーバで生成したインデックスデータを、他のSolrサーバに自動でコピー(複製同期)することができます。1つのSolrサーバがダウンしたとしても、バックアップのSolrサーバで検索処理を維持できます。また、インデックスを作成するSolrサーバと、検索を担当するSolrサーバを分けることで、「インデックス作成を行う重い処理を実行中であっても、検索性能が低下しない」という利点もあります。

【分散インデックス】
1つのSolrサーバで非常に大きなインデックスを作成すると、メモリをインデックスに展開しきれずに、検索性能が大きく落ちてしまう可能性があります。そこで、Solrには、複数のSolrサーバに分散しているインデックスから返される検索結果を取りまとめて処理する機能があります。

【クエリパラメータ】
Solrサーバに検索クエリを投げる際のパラメータが多様にあって、さまざまな検索方法指定をすることができます。

TOPに戻る

主な特徴

【ファセット】
「ファセット」という、単語、クエリ、範囲に対する件数を返す機能があります。商用検索エンジンでも、この機能を持っているものは、そう多くありません。

【拡張性】
内部は、構造的に複数のコンポーネントに分かれていて、それぞれにプラグインシステムがあるため、拡張性に優れています。

【データベースとの親和性】
DataImportHandlerという機能を使うと、OracleやPostgreSQLなどのデータベースから、直接文書データを取り込むことができます。

【規模を拡張しやすい】
規模拡大(スケール)する機能や方法が用意されています。

【高速性】
高速化を可能にするキャッシュ機構を備えています。

【日本語対応】
さらに精度高く日本語に対応するための、トークナイザやフィルタを利用することができます。

TOPに戻る

同様製品(概要情報)

同様な機能を提供する製品は、以下のようなものがあります。

商用製品:「Fast ESP」、「ConceptBase Enterprise Search」

オープンソース製品:「Katta」、「Senna」、「Namazu」

TOPに戻る

導入事例

Apacheプロジェクトであるため、OSSの中でも信頼性が高く、世界中で導入されている実績があります。

TOPに戻る

ライセンス情報

「Apache Solr」のライセンスは「Apache License 2.0」です。このライセンスに従うことを条件として、ソースコードの改変と公開が許可されています。

TOPに戻る

ダウンロード

ダウンロードページ

TOPに戻る

※定期的にメンテナンスを実施しておりますが、一部情報が古い場合がございます。ご了承ください。

Apache Solr最新TOPICS

最新情報はありません。

Apache Solr最新CLOSEUPコラム

  • オープソース書籍(サイド)

OSS×Cloud ACCESS RANKING

  • OSSNEWSに広告を掲載しませんか?

facebook

twitter