Elasticsearchは、事前のスキーマ定義(データマッピング)は行わずに、データ投入を開始できます。フィードしたフィールド値から自動的に型などが判別され、データ投入後にスキーマの調整や修正を行えます。
また、明示的にスキーマ定義を行うことも可能です。
全文検索エンジンとは、大量にあるドキュメントデータの中から、指定したキーワードを含むドキュメントデータを高速に検索するための仕組みです。
「検索条件との関係性/関連性が高いデータを抽出して返す」という特徴があります。
Elasticsearchは全文検索エンジンとして高い能力を発揮できます。
Elasticsearchは検索処理の高速性を特徴としています。
「全文検索のための有限状態トランスデューサを使用した転置インデックス」「数値データや地理データを格納するためのBKDツリー」「分析用カラムストア」などの技術により高速検索を実現しています。
高速検索が可能なことにより、「繰り返し検索」や「広範囲検索」などの実行が容易となるため、データ活用性をより向上できます。
Elasticsearchは、多様なデータタイプの検索に対応します。
・テキスト
・数値
・構造化データ
・非構造化データ
・地理情報
・メトリック など
Elasticsearchはマルチテナントをサポートしているため、柔軟に運用できます。
Elasticsearchは分散環境での安全な運用を考慮して設計されています。複数サーバを1つのクラスタとして構成できます。クラスタ構成が前提となっているため、マシン1台の場合でも1台構成のクラスタとして起動します。
Elastcisearchで扱うデータは、クラスタに所属する各サーバに分散して保存されます。Elasticsearchは障害を検知し、クラスタとデータを安全に保って運用を継続します。
クラスタを構成する1つのサーバが停止してしまった場合は、そのサーバを切り離した状態でサービスを継続できます。
また、データを複数サーバに分散配置する構成にしておくことで、データが失われる可能性を下げる冗長化システムを構築できます。
Elasticsearchは「数百台のクラスタ構成」や「ペタバイト級データ」にも対応でき、プロトタイプからプロダクションまでスムーズに移行できます。
システムを停止することなくElasticsearchサーバを追加して、システムを拡張できます。Elasticsearchマシンを追加すると、既存データの分散/レプリカなども自動で実行され、クラスタ全体に渡るインデックスとクエリの分散も自動的に調整されます。1つのノードで実行中でも、300ノードのクラスタで実行中でも、ハイパフォーマンスを維持したままアクセスできます。
導入時は最小構成でスタートして、データ量やアクセス量の増加に合わせてサーバを追加するようなシステム拡張が可能であるため、極めてスムーズな運用が実現します。
Elasticsearchはブラックボックスではなく、完全にビジブルでコントロール可能です。
直観的なAPIでモニタリングや管理できます。
Googleは、データ管理と分析の分野で、7つの主要なオープンソース中心の企業との戦略的パートナーシップを発表した。 パートナーシップ企業 Googleの戦略的パートナーシップとなったのは以下の7企業。 1.Confluent 2.DataStax 3.Elastic
OSS×Cloud ACCESS RANKING