「Apache Hadoop」の主要技術③ 並列分散処理フレームワーク「MapReduce」として、「概要」「フォールトトレラント」「Apache Hadoopでの実装」について紹介します。

「Apache Hadoop」の主要技術③ 並列分散処理フレームワーク「MapReduce」

「Apache Hadoop」の主要技術③ 並列分散処理フレームワーク「MapReduce」として、「概要」「フォールトトレラント」「Apache Hadoopでの実装」について紹介します。

■関連する比較ページ

「Apache Hadoop」の主要技術③ 並列分散処理フレームワーク「MapReduce」

■概要

MapReduceは、コンピュータクラスタ上の巨大データセットに対する分散コンピューティングを支援する目的で、Googleによって2004年に導入されたプログラミングモデルです。

■フォールトトレラント

ノードが途中で失敗した場合、各フェーズのタスクはフォールトトレラントな方法で実行されます。

失敗ノードに割り当てられたタスクは残りのノードの間で再分配され、小さなランタイムオーバーヘッドで再実行します。

■Apache Hadoopでの実装

Apache Hadoopで実行されているほとんどのプログラムはMapReduceの計算パラダイムで記述されています。

アプリケーションは多くの小さな作業断片に分割され、それぞれがクラスタ内の任意のノードで個別に実行されます。

個別実行完了後に、これらの独立したプロセスの結果がグループとしてまとめられ処理されます。

 

参考元サイト

※定期的にメンテナンスを実施しておりますが、一部情報が古い場合がございます。ご了承ください。

Apache Hadoop最新CLOSEUPコラム

イベント情報

セミナー講演資料

無料資料プレゼント

2021/03/04 セキュリティDAYS Keyspider資料

講演資料を見るには、 プライバシーポリシーに同意して、送付先メールアドレスをご入力しご請求ください。

またご入力いただきました情報は、当該資料の作成・提供企業とも共有させていただき、当社及び各社のサービス、製品、セミナー、イベントなどのご案内に使用させていただきます。

本資料を見るには次の画面でアンケートに回答していただく必要があります。



セミナー講演資料公開中

注目のDB技術「HTAP」とは? ~手軽に、かつ高速に、リアルタイム分析を実現する方法~

データ分析の課題をAWS Analyticsサービスで解決する方法

上からも下からもプレッシャー中間管理職の「悩み」をデータの視点で解決 〜タイムリーなデータ活用、円滑な状況共有を導く分かりやすいデータストーリーとは〜

  • オープソース書籍(サイド)
  • OSSNEWSに広告を掲載しませんか?

facebook

twitter