2021年 秋期 データベーススペシャリスト 午前 問18

ビッグデータ処理基盤に利用され、オープンソースソフトウェアの一つであるApache Sparkの特徴はどれか。

 ア  MapReduceの考え方に基づいたバッチ処理に特化している。
 イ  RDD(Resilient Distribute Dataset)と呼ばれるデータ集合に対して変換を行う。
 ウ  パブリッシュ/サブスクライブ(Publich/Subscribe)型のメッセージモデルを採用している。
 エ  マスタノードをもたないキーバリューストアである。


答え イ


解説

 ア  MapReduceの考え方に基づいたバッチ処理に特化しているのは、Apache Hadoopです。
 イ  RDD(Resilient Distribute Dataset)と呼ばれるデータ集合に対して変換を行うのは、Apache Sparkです。
 ウ  パブリッシュ/サブスクライブ(Publich/Subscribe)型のメッセージモデル(出版-購読型モデル)を採用しているのは、MQTT(Message Queuing Telemetry Transport)です。
 エ  マスタノードをもたないキーバリューストア(Key-Value Store、KVS)であるのは、AmazonのRedisです。


キーワード
・Apache Spark

キーワードの解説
  • Apache Spark
    ビッグデータや機械学習など、大規模なデータを扱うクラスターコンピューティング向け分散処理フレームワークで、特徴として提供される簡素なAPIを使って柔軟な処理モデルを容易にプログラミング可能なこと、大規模データに対して従来のMapReduceに比べ遥かに短い時間で処理が行えることなどがある。

もっと、「Apache Spark」について調べてみよう。

戻る 一覧へ 次へ