Dieser Kurs behandelt einen Teil der Datenaufbereitungsphase des Lebenszyklus des Machine Learnings (ML). In diesem Kurs lernst du Strategien zur Datenvalidierung kennen, einschließlich solcher zur Vermeidung von Verzerrungen und zur Aufrechterhaltung der Datensicherheit. Es werden auch einige Amazon Web Services (AWS)-Services vorgestellt, die bei der Datenvalidierung helfen können, darunter AWS Glue DataBrew und AWS Glue Data Quality. Du lernst auch die finalen Schritte der Datenvorbereitung und -konfiguration kennen, z. B. das Aufteilen, Mischen, Erweitern und Konfigurieren von Datensätzen zum Laden in deine Modelltrainingsressource.

Kursstufe: Fortgeschritten
Dauer: 45 Minuten

Aktivitäten

Online-Materialien
Eine Vorführung
Fragen zum Wissenscheck
Ein Test zum Kurs

Kursziele

Erläutern, wie wichtig es ist, die Datenintegrität zu gewährleisten
Ermitteln grundlegender Verzerrungsmetriken vor dem Training
Beschreiben von Strategien zur Behebung des Klassenungleichgewichts in Datensätzen
Beschreiben der wichtigsten AWS-Services zur Validierung der Datenqualität
Verwenden von AWS-Tools, um Verzerrungsquellen in Daten zu identifizieren und abzuschwächen.
Beschreiben von Techniken für die Verwendung von AWS-Services zur Datenverschlüssselung
Erkennen der Auswirkungen von Compliance-Anforderungen
Beschreiben des Nutzens und der Techniken zum Aufteilen, Mischen und Erweitern von Datensätzen
Benennen der Datenformate, die beim Modelltraining verwendet werden
Benennen der AWS-Tools und -Services für die Konfiguration von Modelltrainingsdaten
Beschreiben, wie Daten konfiguriert werden, um sie in eine Modelltrainingsressource einzuspeisen

Zielgruppe

Cloud-Architekten
Machine Learning Engineers

Empfohlene Fähigkeiten

Mindestens 1 Jahr Erfahrung mit Amazon SageMaker und anderen AWS-Services für ML-Engineering.
Mindestens 1 Jahr Erfahrung in einer verwandten Position wie Backend-Softwareentwickler, DevOps-Entwickler, Dateningenieur oder Datenwissenschaftler.
Ein grundlegendes Verständnis von Programmiersprachen wie Python.
Frühere Kurse im AWS ML Engineer Associate Learning Plan

Kursinhalt

Abschnitt 1: Einführung

Lektion 1: Anleitung zum Kurs
Lektion 2: Kursübersicht
Lektion 3: Grundlagen der Datenvalidierung

Abschnitt 2: Daten validieren

Lektion 4: Beheben des Klassenungleichgewichts
Lektion 5: AWS-Tools und -Services für die Datenvalidierung und Vermeidung von Verzerrungen
Lektion 6: Identifizieren und Abschwächen von Verzerrungen mit Amazon SageMaker Clarify
Lektion 7: Datensicherheit und Compliance

Abschnitt 3: Finale Schritte der Datenaufbereitung