2021年秋期データベーススペシャリスト午前問18

ビッグデータ処理基盤に利用され、オープンソースソフトウェアの一つであるApache Sparkの特徴はどれか。

ア	MapReduceの考え方に基づいたバッチ処理に特化している。
イ	RDD(Resilient Distribute Dataset)と呼ばれるデータ集合に対して変換を行う。
ウ	パブリッシュ/サブスクライブ(Publich/Subscribe)型のメッセージモデルを採用している。
エ	マスタノードをもたないキーバリューストアである。

【キーワード】
・Apache Spark

【キーワードの解説】

Apache Spark
ビッグデータや機械学習など、大規模なデータを扱うクラスターコンピューティング向け分散処理フレームワークで、特徴として提供される簡素なAPIを使って柔軟な処理モデルを容易にプログラミング可能なこと、大規模データに対して従来のMapReduceに比べ遥かに短い時間で処理が行えることなどがある。

もっと、「Apache Spark」について調べてみよう。

2021年 秋期 データベーススペシャリスト 午前 問18