本課程涵蓋機器學習 (ML) 生命週期的部分資料準備階段。在本課程中,您將了解資料基礎知識,包括如何識別資料類型,將區分有效資料與無效資料,以及視覺化和分析資料。您將了解機器學習過程中使用的一些核心 Amazon Web Services (AWS) 儲存服務,例如 Amazon Simple Storage Service (Amazon S3)。本課程會分享如何根據您的特定 ML 需求,選擇最有效的 AWS 儲存決策和資料格式。最後,您將進一步了解有關協助擷取和合併資料的 AWS 服務,例如 Amazon Kinesis。
- 課程等級:進階
- 課程長度:60 分鐘
活動
- 線上教材
- 示範
- 知識檢測問題
- 課程評量
課程目標
- 描述資料收集的基礎知識。
- 定義資料格式和擷取機制。
- 描述視覺化資料的不同方法。
- 描述用於 ML 資料收集的 AWS 儲存選項,包括使用案例和權衡取捨。
- 根據成本、效能和資料結構,選擇最有效的儲存決策。
- 根據資料存取模式,為 ML 任務選擇適當的資料格式。
- 描述用於資料擷取的 AWS 串流資料來源。
- 使用協助資料傳輸的 AWS 服務,從 AWS 儲存服務擷取資料。
- 描述如何合併來自多個來源的資料。
- 識別涉及容量和可擴展性的資料擷取和儲存問題的原因。
目標對象
- 雲端架構師
- 機器學習工程師
建議技能
- 擁有至少 1 年使用 Amazon SageMaker 和其他 AWS 服務進行 ML 工程的經驗。
- 在後端軟體開發人員、DevOps 開發人員、資料工程師或資料科學家等相關職位至少 1 年的經驗。
- 對 Python 等程式設計語言的基本理解。
- AWS ML 工程師助理學習計畫中的前導課程。
課程大綱
- 第 1 節:簡介
- 第 1 課:如何運用本課程
- 第 2 課:領域 1:簡介
- 第 3 課:課程總覽
- 第 4 課:資料收集的基礎
- 第 2 節:資料收集
- 第 5 課:資料類型
- 第 6 課:資料視覺化和探索資料分析
- 第 3 節:AWS 資料來源和服務
- 第 7 課:AWS 儲存選項
- 第 8 課:選擇儲存空間
- 第 4 節:擷取和合併資料
- 第 9 課:資料擷取
- 第 10 課:資料擷取
- 第 11 課:資料合併
- 第 12 課:資料擷取和儲存疑難排解
- 第 5 節:結論
- 第 13 課:課程總結
- 第 14 課:評量
- 第 15 課:聯絡我們
關鍵字
- Gen AI
- 生成式 AI