Apache Solrは、オープンソースのテキスト検索エンジン「ApacheLucene」上に構築されており、Luceneの検索能力を活用して動作します。
あらゆるデータタイプにわたる強力なマッチング機能を実現します。
・フレーズ
・ワイルドカード
・結合
・グループ化 など
ApacheLuceneは、完全にJavaで記述されたフル機能の高性能テキスト検索エンジンです。
全文検索機能を必要とするほぼすべてのアプリケーションに適したテクノロジーです。
「Lucene Core」はJavaライブラリです。
・スケーラブルで高性能なインデックス作成
・強力で正確かつ効率的な検索アルゴリズム
・クロスプラットフォームソリューション
・インデックス作成機能
・検索機能
・スペルチェック機能
・ヒットハイライト機能
・高度分析機能
・トークン化機能 など
PyLuceneサブプロジェクトは、LuceneCoreのPythonバインディングを提供します。
Apache Solrには、Solrインスタンスを簡単に制御できる管理ユーザーインターフェースが付属しています。
ポイント
・リッチでパワフルなユーザーインターフェース
・「分析」「データ探索」などのための高度なインターフェースも
・組み込み型---追加インストールなしでSolrの状態を深く洞察
・クエリインターフェース---コード記述なしでデータを即座に探索
・「ログ」「スレッド」「システムプロパティ」を探索
Apache Solrは、柔軟で適応性があり、簡単に構成できます。
構成を簡素化しながら、さまざまなニーズに適応するように設計されています。
Solrには「オートコンプリート(先行入力検索)機能」や「スペルチェック機能」などの入力サポート機能が付属しています。
構成可能なヒットハイライト機能により、ユーザーは一致が発生する場所に正確に集中できます。
Solrは、Luceneの「Near Real-Time Indexing機能」を利用して、コンテンツを見たいときに確実に表示できるようにできます。
Solrは、構成可能かつ拡張可能な組み込みキャッシング機能を提供します。
・キャッシュのきめ細かい制御---パフォーマンス最適化が容易に
・スマートキャッシングオプション---繰り返し結果を厳密に制御可能
Solrはマルチテナントアーキテクチャをサポートしています。
複数の検索インデックスを作成できるため、ユーザーとコンテンツを簡単に分離できます。
Apache ZooKeeperは、信頼性の高い分散調整を可能にするオープンソースサーバを開発する取り組みです。
「構成情報維持機能」「命名機能」「分散同期機能」「フォールトトレランス機能」などにより、グループサービスを機能させるための集中型サービスを提供します。
ApacheZookeeper上に構築されたSolrを使用すると、簡単にスケールアップやスケールダウンを実施できます。
ポイント
・高度にスケーラブルでフォールトトレラントな環境を構築可能
・「スプリットブレイン問題」を回避
・シャード分割機能---コンテンツ全体のインデックス再作成なしで、段階的ストレージ容量追加
・「クエリ量が非常に多い数千の計算ノード管理」や「数十億のドキュメント処理」をサポート可能
Apache Solrは、Apacheライセンスのオープンソースであり、明確に定義された多くの拡張ポイントを公開しているため、コードを変更して利用できます。
カスタムコードをロードして、Solr内のさまざまなタスクを実行できます。
・カスタムインデックス作成機能
・カスタム分析機能
・カスタムリクエスト処理機能
・カスタムクエリ解析機能
・テキストフィールドの「カスタムアナライザー」や「トークンフィルター」
・カスタムフィールドタイプ など
Apache Solrでは、各種プラグインによる機能拡張をサポートしています。
・リッチコンテンツ用インデックス作成機能---PDFファイル、Wordファイル
・言語検出機能
・検索結果クラスタリング機能
・データインポート機能
・Apache UIMA---非構造化情報のマルチモーダル分析
・Apache Velocity---Javaコードで定義されたオブジェクト参照 など
→cwiki.apache.org →confluence →display →SOLR →SolrPlugins
Apache Solrは、組み込みセキュリティ機能を備えています。
・SSLサポート
・認証機能
・ロールベース管理機能 など
プラグインによるセキュリティ強化も可能です。
SolrはJMX(Java Management Extensions)を介して大量のメトリックデータを公開しているため、インスタンスに関する深い洞察を実施できます。
管理インターフェースからSolrのログファイルに簡単にアクセスできます。
Apache Software Foundation「Luceneプロジェクト管理委員会」は、10月17日、 全文検索エンジン「Apache Lucene 7.1.0」および検索プラットフォーム「Apache Solr 7.1.0」の公開を発表した。 【「Apache Lucene」とは】 https://www.ossnews.jp/oss_info/Apache_Lucene ...
OSS×Cloud ACCESS RANKING