實驗室概觀
在此實驗室中,您會使用 AWS Key Management Service (AWS KMS) KMS 管理金鑰對存放在 Amazon Simple Storage Service (Amazon S3) 與 EMR 檔案系統 (EMRFS) 中的資料啟用用戶端靜態加密。您使用 Amazon EMR 建立安全組態,使用您指定的 AWS KMS 管理金鑰以用戶端加密來加密寫入 S3 的物件,並以用於加密物件的相同金鑰來解密物件。這讓您能更輕鬆地利用 Amazon EMR 上的 Apache Spark、Apache Tez 和 Apache Hadoop MapReduce 等架構,以對機密資料執行大數據分析、串流處理、機器學習和 ETL 工作負載。
目標
此實驗室結束時,您應該能夠:
- 建立 Amazon S3 儲存貯體。
- 使用 AWS KMS 建立金鑰。
- 在 EMR 中建立安全組態,以使用 AWS KMS 管理金鑰啟用用戶端加密。
- 使用 AWS 管理主控台啟動 Amazon EMR 叢集。
- 使用 EMR 檔案系統 (EMRFS) 從 Amazon S3 讀取和寫入物件。
- 直接從 Amazon S3 檢視 EMR 輸出資料。
技術知識先決條件
若要順利完成此實驗室,你應該熟悉 Hadoop 和 Hadoop 分散式檔案系統 (HDFS) 的基礎知識。您也應該熟悉基本的 Linux 伺服器管理,並能順利使用 Linux 命令列工具。
圖示圖例
此實驗室使用各種圖示提醒您注意不同類型的指示和注意事項。下列清單說明各圖示的用途:
- 提醒:有特殊影響或重要性的資訊 (如果您錯過此資訊,不會對設備或資料造成太大的問題,但可能會導致需要重複特定步驟)。
- 警告:不可逆且可能造成命令或程序失敗的動作 (包含設定後無法變更的警告)。
- 任務完成:實驗室中的結論或摘要重點。
- 注意:提示、秘訣或重要指引。
- 重新整理:您可能需要重新整理 Web 瀏覽器頁面或清單,以顯示新資訊的時機。
- 命令:您必須執行的命令。
- 預期輸出:您可使用的範例輸出,以驗證命令的輸出內容或經過編輯的檔案。