多数のサーバで構成された大規模な分散ファイルシステム機能を提供し、MapReduceによる大規模サーバの分散処理を実現するOSSはどれか。
ア |
Apache Hadoop |
|
イ |
Apache Kafka |
ウ |
Apache Spark |
|
エ |
Apache Storm |
答え ア
【解説】
ア |
Apache Hadoopは、巨大データの取り扱いを目的とした分散処理のフレームワークで、分散処理としてMapReduceを行っています。 |
イ |
Apache Kafkaは、オープンソースの分散メッセージングシステムです。 |
ウ |
Apache Sparkは、ビッグデータのワークロードを処理するために使用されているオープンソースの分散処理システムです。 |
エ |
Apache Stormは、オープンソースで耐障害性に優れた高速分散処理型ニアリアルタイムビッグデータ処理フレームワークです。 |
【キーワード】
・MapReduce
【キーワードの解説】
- MapReduce
mapとreduceの処理で行う並列分散処理です。
map処理は、入力ファイルの各行からKeyとValueの組合せを生成します。
reduce処理は、map処理で作られたKeyとValueの組合せから別のKeyとValueの組合せを生成します。
もっと、「MapReduce」について調べてみよう。
戻る
一覧へ
次へ
|