Apache Kafka(アパッチ カフカ)とは、分散ストリーミングプラットフォームです。「Pull型」「高スループット」などの特徴があり、ストリーミングデータパイプライン構築に利用できます。
Apache Kafkaは、分散環境において「高スループット」かつ「低レイテンシ」で、大規模データ(ログデータ/イベントデータなど)を高速に取り込み、配信できるメッセージングシステムです。オンライン/オフライン両方のメッセージ取得に対応します。
2011年、LinkedInがオープンソース公開しました。
その後、Apache Software Foundationが開発を行っています。
「リアルタイムストリーミングデータパイプライン構築」や「データストリームを変換するリアルタイムストリーミングアプリケーション」などを構築できます。
Apache Kafkaのライセンスは「Apache License 2.0」です。
詳細について、こちらを参照ください。
→GitHub →kafka-dev/kafka →LICENSE
Apache Kafkaは、「LinkeIn」「Twitter」「Netflix」「Uber」「Tumblr」などでの採用実績があります。
同様な機能を提供する製品として、次のようなものがあります。
オープンソース製品:「Apache Storm」「RabbitMQ」など。
Kafka開発チームは、11月1日、 分散ストリーミングプラットフォーム「Apache Kafka 1.0.0」を発表した。 【「Apache Kafka」とは】 https://www.ossnews.jp/oss_info/Apache_Kafka 【1.0.0のポイント】 ・企業での利用に向けた拡張性と信頼性の強化 ・性能改善 ・JBODサポート改善 ・安定性強化
OSS×Cloud ACCESS RANKING