ビッグデータのデータ貯蔵場所であるデータレイクの特徴として、適切なものはどれか。
ア | あらゆるデータをそのままの形式や構造で格納しておく。 |
イ | データ量を抑えるために、データの記述情報であるメタデータを格納しない。 |
ウ | データを格納する前にデータ利用方法を設計し、それに沿ってスキーマをあらかじめ定義しておく。 |
エ | テキストファイルやバイナリファイルなど、格納するデータの形式に応じてリポジトリを使い分ける。 |
答え ア
【解説】
データレイク(data lake)は、ログファイルや画像ファイル、音声ファイルなどを未加工のままストレージ(記憶ディスク)に貯めこんだもので、必要な時に貯めこんだデータファイルの内容を検索・参照できます。
【キーワード】
・メタデータ