「Apache Hadoop」の主要技術① 分散ファイルシステム「HDFS」として、「概要」「高速処理」について紹介します。

「Apache Hadoop」の主要技術① 分散ファイルシステム「HDFS」

「Apache Hadoop」の主要技術① 分散ファイルシステム「HDFS」として、「概要」「高速処理」について紹介します。

■関連する比較ページ

「Apache Hadoop」の主要技術① 分散ファイルシステム「HDFS」

■概要

「Hadoop分散ファイルシステム(HDFS:Hadoop Distributed File System)」は、「分散」「スケーラブル」「ポータブル」を実現し非常に大きなファイルを確実に保存できるように、Hadoop独自の分散ファイルシステムとして設計されています。

一般的なサーバにデータを格納し、クラスタ全体で非常に高い総帯域幅を提供する分散ファイルシステムです。

■高速処理

HDFSの主な利点として「非常に高い入出力速度」があります。

HDFSはHadoopクラスタ全体に分散ファイルを保存することによって非常に高い帯域幅を提供します。

個々のタスクが実行されるノード(もしくは近い場所)にファイルが配置されるため、タスクは近い場所にあるファイルに対する処理が可能となります。遠距離にあるデータを取得する必要がなくなるため、データ入出力に関するオーバーヘッドが軽減されます。

Apache Hadoop最新CLOSEUPコラム

イベント情報

セミナー講演資料

無料資料プレゼント

2021/03/04 セキュリティDAYS Keyspider資料

講演資料を見るには、 プライバシーポリシーに同意して、送付先メールアドレスをご入力しご請求ください。

またご入力いただきました情報は、当該資料の作成・提供企業とも共有させていただき、当社及び各社のサービス、製品、セミナー、イベントなどのご案内に使用させていただきます。

本資料を見るには次の画面でアンケートに回答していただく必要があります。



セミナー講演資料公開中

ビッグデータ処理のデータベースとして MySQL HeatWave が最適な理由 〜AWS Aurora/Redshift、GCP BigQuery との性能&コスト比較〜

データ活用におけるクレンジングの課題 〜「データ連携ツールを使っても非エンジニアには負担」の解決策〜

注目のDB技術「HTAP」とは? ~手軽に、かつ高速に、リアルタイム分析を実現する方法~

  • オープソース書籍(サイド)
  • OSSNEWSに広告を掲載しませんか?

facebook

twitter