Dieser Kurs behandelt einen Teil der Datenaufbereitungsphase des Lebenszyklus des Machine Learnings (ML). In diesem Kurs lernst du Strategien zur Datenvalidierung kennen, einschließlich solcher zur Vermeidung von Verzerrungen und zur Aufrechterhaltung der Datensicherheit. Es werden auch einige Amazon Web Services (AWS)-Services vorgestellt, die bei der Datenvalidierung helfen können, darunter AWS Glue DataBrew und AWS Glue Data Quality. Du lernst auch die finalen Schritte der Datenvorbereitung und -konfiguration kennen, z. B. das Aufteilen, Mischen, Erweitern und Konfigurieren von Datensätzen zum Laden in deine Modelltrainingsressource.
- Kursstufe: Fortgeschritten
- Dauer: 45 Minuten
Aktivitäten
- Online-Materialien
- Eine Vorführung
- Fragen zum Wissenscheck
- Ein Test zum Kurs
Kursziele
- Erläutern, wie wichtig es ist, die Datenintegrität zu gewährleisten
- Ermitteln grundlegender Verzerrungsmetriken vor dem Training
- Beschreiben von Strategien zur Behebung des Klassenungleichgewichts in Datensätzen
- Beschreiben der wichtigsten AWS-Services zur Validierung der Datenqualität
- Verwenden von AWS-Tools, um Verzerrungsquellen in Daten zu identifizieren und abzuschwächen.
- Beschreiben von Techniken für die Verwendung von AWS-Services zur Datenverschlüssselung
- Erkennen der Auswirkungen von Compliance-Anforderungen
- Beschreiben des Nutzens und der Techniken zum Aufteilen, Mischen und Erweitern von Datensätzen
- Benennen der Datenformate, die beim Modelltraining verwendet werden
- Benennen der AWS-Tools und -Services für die Konfiguration von Modelltrainingsdaten
- Beschreiben, wie Daten konfiguriert werden, um sie in eine Modelltrainingsressource einzuspeisen
Zielgruppe
- Cloud-Architekten
- Machine Learning Engineers
Empfohlene Fähigkeiten
- Mindestens 1 Jahr Erfahrung mit Amazon SageMaker und anderen AWS-Services für ML-Engineering.
- Mindestens 1 Jahr Erfahrung in einer verwandten Position wie Backend-Softwareentwickler, DevOps-Entwickler, Dateningenieur oder Datenwissenschaftler.
- Ein grundlegendes Verständnis von Programmiersprachen wie Python.
- Frühere Kurse im AWS ML Engineer Associate Learning Plan
Kursinhalt
Abschnitt 1: Einführung
- Lektion 1: Anleitung zum Kurs
- Lektion 2: Kursübersicht
- Lektion 3: Grundlagen der Datenvalidierung
Abschnitt 2: Daten validieren
- Lektion 4: Beheben des Klassenungleichgewichts
- Lektion 5: AWS-Tools und -Services für die Datenvalidierung und Vermeidung von Verzerrungen
- Lektion 6: Identifizieren und Abschwächen von Verzerrungen mit Amazon SageMaker Clarify
- Lektion 7: Datensicherheit und Compliance
Abschnitt 3: Finale Schritte der Datenaufbereitung
- Lektion 8: Aufteilen, Mischen und Erweitern von Datensätzen
- Lektion 9: Konfigurieren der Daten für das Modelltraining
Abschnitt 4: Fazit
- Lektion 10: Zusammenfassung des Kurses
- Lektion 11: Prüfung
- Lektion 12: Kontakt
Schlüsselwörter
- Gen KI
- Generative KI