Apache Kafkaを使用することで、さまざまなユースケースに対応できます。
Apache Kafkaは、大規模なメッセージ処理アプリケーションに適しており、メッセージブローカーとして機能します。
同様機能を提供する「ActiveMQ」「RabbitMQ」などのメッセージングシステムに匹敵します。
Apache KafkaをWebサイトアクティビティトラッキングに利用する場合、1つのユーザーアクティビティが1つのトピックとなり、トピックに対してサイトアクティビティ(ページビュー、検索、ユーザーが取る可能性のある他のアクション)が公開されます。
これらのフィードは、さまざまなユースケースのサブスクリプションに利用できます。
Apache Kafkaは、運用監視として、分散アプリケーションからの統計を集約して、運用データの一元的なフィードを作成する処理に利用できます。
ログ集約は、通常、物理的なログファイルをサーバーから収集し、ファイルサーバ(HDFS)に配置して処理します。
Kafkaはファイルの詳細について、ログやイベントデータをメッセージストリームとして抽象化する機能を提供します。
Apache Kafkaを利用して、リアルタイムでイベントに反応するスケーラブルなストリーム処理アプリケーションを作成できます。複数のステージからなるパイプライン処理を実現できます。
同様な機能を提供するプロダクトとして、「Apache Storm」「Apache Samza」などがあります。
イベントソーシングとは、状態変更が時間順のレコードシーケンスとして記録されるアプリケーション設計スタイルです。
非常に大きなログデータを保存できるApache Kafkaは、このスタイルで構築されたアプリケーションの優れたバックエンドになります。
Kafkaは、分散システムにおける一種の外部コミットログとして機能できます。
外部コミットログは、ノード間データ複製において、障害ノードがデータを復元するための再同期メカニズムとして機能します。
同様な機能を提供するプロダクトとして、「Apache BookKeeper」などがあります。
参考元サイト
※定期的にメンテナンスを実施しておりますが、一部情報が古い場合がございます。ご了承ください。
Kafka開発チームは、11月1日、 分散ストリーミングプラットフォーム「Apache Kafka 1.0.0」を発表した。 【「Apache Kafka」とは】 https://www.ossnews.jp/oss_info/Apache_Kafka 【1.0.0のポイント】 ・企業での利用に向けた拡張性と信頼性の強化 ・性能改善 ・JBODサポート改善 ・安定性強化
OSS×Cloud ACCESS RANKING