ビッグデータ処理基盤に利用され、オープンソースソフトウェアの一つであるApache Sparkの特徴はどれか。
ア |
MapReduceの考え方に基づいたバッチ処理に特化している。 |
イ |
RDD(Resilient Distribute Dataset)と呼ばれるデータ集合に対して変換を行う。 |
ウ |
パブリッシュ/サブスクライブ(Publich/Subscribe)型のメッセージモデルを採用している。 |
エ |
マスタノードをもたないキーバリューストアである。 |
答え イ
【解説】
ア |
MapReduceの考え方に基づいたバッチ処理に特化しているのは、Apache Hadoopです。 |
イ |
RDD(Resilient Distribute Dataset)と呼ばれるデータ集合に対して変換を行うのは、Apache Sparkです。 |
ウ |
パブリッシュ/サブスクライブ(Publich/Subscribe)型のメッセージモデル(出版-購読型モデル)を採用しているのは、MQTT(Message Queuing Telemetry Transport)です。 |
エ |
マスタノードをもたないキーバリューストア(Key-Value Store、KVS)であるのは、AmazonのRedisです。 |
【キーワード】
・Apache Spark
【キーワードの解説】
- Apache Spark
ビッグデータや機械学習など、大規模なデータを扱うクラスターコンピューティング向け分散処理フレームワークで、特徴として提供される簡素なAPIを使って柔軟な処理モデルを容易にプログラミング可能なこと、大規模データに対して従来のMapReduceに比べ遥かに短い時間で処理が行えることなどがある。
もっと、「Apache Spark」について調べてみよう。
戻る
一覧へ
次へ
|