Apache Hbase(アパッチ エイチベース)とは、大規模分散データベース管理システムです。「Hadoopベース」「NoSQL」「スケーラブル」などの特徴があります。

オープンソースのデータベース/Apache Hbaseとは

Apache Hbase(アパッチ エイチベース)とは、大規模分散データベース管理システムです。「Hadoopベース」「NoSQL」「スケーラブル」などの特徴があります。

基本情報

概要

Apache Hbase(アパッチ エイチベース)とは、大規模分散データベース管理システムです。「Hadoopベース」「NoSQL」「スケーラブル」などの特徴があります。

基本説明

Apache Hbaseは、分散データ処理基盤「Apache Hadoop」上で動作し、分散型のスケーラブルなデータストアです。

大容量データセットに対して高速ランダムアクセス機能を提供します。

経緯

Apache Hbaseは、Apacheトップレベルプロジェクトとして開発されています。

TOPに戻る

主な特徴

Google「BigTable」モデル

HadoopやHBaseは、Googleの大規模分散処理基盤「BigTable」をモデルにして開発されています。

「Hadoop」ベース

Apache Hbaseは、Hadoopクラスタ上に構築され、データはHDFS(Hadoop Distributed File System)に格納されます。

Hadoopのエコシステムを活用することにより、「MapReduceジョブ機能」などを使用でき、「データ冗長性」などについても確保できます。

データモデル

HBaseでは、多次元要素キー(行キー、列キー、タイムスタンプなど)で、データが一意に定まります。

キーを動的に定義できることにより、データ構造変更や格納データ種類追加に対応可能です。非構造データやスパースデータ(まばらなデータ)にも対応できます。

HBase構成

HBaseクラスタは以下の要素で構成されます。
・メタデータ管理「Master」
・構成情報管理「Apache ZooKeeper
・データ格納処理「Region Server」

スケーラブル

Apache Hbaseは、「非常な大きな規模まで拡張が可能なアーキテクチャ」であることが大きな特徴です。サーバ台数を増やすことで拡張できます。データサイズ、処理負荷、パフォーマンス要件に応じてデータベースの水平拡張が可能です。

実運用で6Pバイト以上のデータを格納している例もあります。

負荷分散(シャーディング)

格納されたデータは自動的に分割され、キーのグループを「リージョン」という単位で複数の「リージョンサーバ」に格納します。リージョン分割やリージョンリバランスも自動で行えます。

リージョン単位で格納されたデータに対して並列処理を実行することで、システム全体のパフォーマンスが向上します。

高速性

HBaseは「LSM-Tree」という仕組みで、主にメモリ上で処理を行うことにより、高速性を獲得しています。

データ一貫性

HBaseは「強い一貫性」を維持できます。

あるデータの書き込み後、以降の読み出しでは書き込まれたデータが読み出されることを保証します。

高可用性(自動フェイルオーバー)

HBaseでは「ZooKeeper」が各ノードの死活監視を行っています。クラスタ内のいずれかのノードに障害が発生した場合、「ZooKeeper」は障害ノードをクラスタから切り離します。

その時点で、自動的に機能がフェールオーバーされ、可用性が維持されます。

セキュリティ

Kerberos認証により「テーブル単位」「列(カラム)単位」でのセキュリティ設定が可能です。

TOPに戻る

同様製品

同様な機能を提供する製品として、次のようなものがあります。

オープンソース製品:「Apache Cassandra」「Hypertable」など。

TOPに戻る

導入事例

「Facebook」「米Yahoo!」「米Flurry」などへの導入実績があります。

TOPに戻る

ライセンス情報

Apache Hbaseのライセンスは「Apache License Version 2.0」です。このライセンスに従うことを条件として、ソースコードの改変と公開が許可されています。

TOPに戻る

ダウンロード

ダウンロードページ

TOPに戻る

参考元サイト

・Wikipedia →Apache HBase
・あしたのオープンソース研究所 →Apache HBase とは
・ZDNet Japan →NoSQL「HBase」はIoTにも最適--柔軟なスキーマでデータ構造の変更に対応
・Cloudera →Apache HBase
・@IT →カラム指向型データベース(HBase、Hypertable、Cassandra)編

TOPに戻る

※定期的にメンテナンスを実施しておりますが、一部情報が古い場合がございます。ご了承ください。

Apache Hbase最新TOPICS

【OSS】分散データベース「Apache HBase 1.4」リリース---660以上のイシューを解決、後方互換性を維持した新機能が導入(2017年12月29日 20:03)

Apache HBaseプロジェクトは、12月19日、 Hadoopベース分散データベース「Apache HBase 1.4」を公開した。 【Apache HBaseとは】 https://www.ossnews.jp/oss_info/Apache_Hbase 【1.4のポイント】 ・1系の最新安定版 ・660以上のイシューを解決 ・後方互換性を維持した新機能が導入 ・H...

Apache Hbase最新CLOSEUPコラム

イベント情報

セミナー講演資料

無料資料プレゼント

2021/03/04 セキュリティDAYS Keyspider資料

講演資料を見るには、 プライバシーポリシーに同意して、送付先メールアドレスをご入力しご請求ください。

またご入力いただきました情報は、当該資料の作成・提供企業とも共有させていただき、当社及び各社のサービス、製品、セミナー、イベントなどのご案内に使用させていただきます。

本資料を見るには次の画面でアンケートに回答していただく必要があります。



セミナー講演資料公開中

【企業ネットワーク向け】ローカルブレイクアウト、適用できないSaaSはありませんか?通信速度や運用に課題はありませんか? 〜LBOに最適なネットワーク機器や管理ツールによる解決策をご提案〜

【再放送】システム責任者が知っておくべき 「MySQLの高可用性/HA構成」 の選択肢と比較 〜 MySQLデータベースのダウンタイム“ゼロ”を目指す〜

システム責任者が知っておくべき 「MySQLの高可用性/HA構成」 の選択肢と比較 〜 MySQLデータベースのダウンタイム“ゼロ”を目指す〜

  • オープソース書籍(サイド)
  • OSSNEWSに広告を掲載しませんか?

facebook

twitter