ラボの概要
このラボでは、EMR File System (EMRFS) を使用して Amazon Simple Storage Service (Amazon S3) に保存されるデータに対して、AWS Key Management Service (AWS KMS) で管理されたキーを使用してクライアント側の保管時の暗号化を有効にします。Amazon EMR を使用して、セキュリティ設定を作成し、S3 に書き込まれるオブジェクトに対して、指定した AWS KMS で管理されたキーを用いてクライアント側の暗号化を実行し、暗号化に使用したキーと同じキーを使用してオブジェクトを復号します。これにより、Amazon EMR で Apache Spark、Apache Tez、Apache Hadoop MapReduce のようなフレームワークを簡単に活用できるようになり、ビッグデータ分析、ストリーム処理、機械学習、機密情報の ETL ワークロードを実行できます。
目標
本ラボを修了すると、次のことができるようになります。
- Amazon S3 バケットを作成する。
- AWS KMS を使用してキーを作成する。
- セキュリティ設定を EMR に作成して AWS KMS で管理されたキーを使用したクライアント側の暗号化を有効にする。
- AWS マネジメントコンソールを使用して Amazon EMR クラスターを起動する。
- EMR File System (EMRFS) を使用して Amazon S3 との間でオブジェクトの読み書きを行う。
- Amazon S3 から EMR 出力データを直接表示する。
技術知識の前提条件
このラボを修了するには、Hadoop と Hadoop Distributed File System (HDFS) の基本的な知識が必要です。Linux サーバー管理に関する基本的な知識があり、Linux コマンドラインツールを使用できることも必要です。
アイコンキー
このラボでは、さまざまな種類の手順と注記への注意を促すため、各種アイコンが使用されています。以下のリストは、各アイコンの目的を説明したものです。
- 警告: 特記事項または重要な情報を表す (この情報を読み忘れても、機器やデータに問題が発生するというわけではありませんが、特定のステップを繰り返す必要が生じる可能性があります)。
- 警告: コマンドやプロセスの失敗に影響を与える可能性のある、元に戻せないアクション (一度設定したら変更できない設定の警告も含む)。
- タスク完了: ラボのまとめや要点を示す。
- 注意: ヒントや重要なガイダンス。
- 更新: ウェブブラウザのページやリストを更新して、新しい情報を表示する必要があることを示す。
- コマンド: 実行する必要があるコマンドを表す。
- 想定される出力: 出力のサンプルであり、コマンドまたは編集済みファイルの出力を確認するときに使用する。