ビッグデータ処理基盤に利用され、オープンソースソフトウェアの一つであるApache Sparkの特徴はどれか。
ア | MapReduceの考え方に基づいたバッチ処理に特化している。 |
イ | RDD(Resilient Distribute Dataset)と呼ばれるデータ集合に対して変換を行う。 |
ウ | パブリッシュ/サブスクライブ(Publich/Subscribe)型のメッセージモデルを採用している。 |
エ | マスタノードをもたないキーバリューストアである。 |
答え イ
【解説】
ア | MapReduceの考え方に基づいたバッチ処理に特化しているのは、Apache Hadoopです。 |
イ | RDD(Resilient Distribute Dataset)と呼ばれるデータ集合に対して変換を行うのは、Apache Sparkです。 |
ウ | パブリッシュ/サブスクライブ(Publich/Subscribe)型のメッセージモデル(出版-購読型モデル)を採用しているのは、MQTT(Message Queuing Telemetry Transport)です。 |
エ | マスタノードをもたないキーバリューストア(Key-Value Store、KVS)であるのは、AmazonのRedisです。 |
【キーワード】
・Apache Spark