Dieser Kurs behandelt einen Teil der Datenaufbereitungsphase des Lebenszyklus des Machine Learnings (ML). In diesem Kurs lernst du mehr über die Datentransformation. In diesem Kurs werden verschiedene Transformationskonzepte und -techniken behandelt, z. B. Datenbereinigung, Kodierung und Feature Engineering. Du erfährst, wie du Amazon Web Services (AWS) Services wie Amazon SageMaker Feature Store, Amazon SageMaker Data Wrangler und AWS Glue nutzen kannst, um deine Daten zu transformieren.
- Kursstufe: Fortgeschritten
- Dauer: 60 Minuten
Aktivitäten
- Online-Materialien
- Eine Vorführung
- Fragen zum Wissenscheck
- Eine Bewertung des Kurses
Kursziele
- Du kannst den Wert der Datenbereinigung und -transformation erklären.
- Erläutere, wie falsche oder doppelte Daten verarbeitet werden.
- Erläutere wie Ausreißer erkannt und behandelt werden.
- Beschreibe, wie fehlende Werte verarbeitet werden.
- Beschreibe die grundlegenden Kodierungstechniken.
- Identifiziere Anwendungsfälle für Feature Engineering.
- Beschreibe die grundlegenden Konzepte, Vorteile und Techniken des Feature Engineering.
- Beschreibe die grundlegenden Techniken zur Auswahl von Features.
- Beschreibe die AWS-Services zur Validierung und Kennzeichnung von Daten.
- Identifiziere AWS-Tools und -Services für die Visualisierung und Transformation von Daten.
- Beschreibe, wie man mithilfe des SageMaker Feature Store Daten einliest und Features verwaltet.
- Beschreibe, wie man Daten mit dem Amazon SageMaker Data Wrangler einliest und umwandelt.
- Beschreibe, wie Daten mithilfe von AWS Glue transformiert werden.
- Identifiziere AWS-Tools und -Services für die Transformation von Streaming-Daten.
- Beschreibe, wie Streaming-Daten mithilfe von AWS Lambda und Apache Spark auf Amazon EMR transformiert werden.
Zielgruppe
- Cloud-Architekten
- Ingenieure für Machine Learning
Empfohlene Fähigkeiten
- Mindestens 1 Jahr Erfahrung mit Amazon SageMaker und anderen AWS-Services für ML-Engineering.
- Mindestens 1 Jahr Erfahrung in einer verwandten Position wie Backend-Softwareentwickler, DevOps-Entwickler, Dateningenieur oder Datenwissenschaftler.
- Ein grundlegendes Verständnis von Programmiersprachen wie Python.
- Frühere Kurse im AWS ML Engineer Associate Learning Plan
Kursübersicht
- Abschnitt 1: Einführung
- Lektion 1: Verwendung dieses Kurses
- Lektion 2: Kursübersicht
- Lektion 3: Grundlagen der Datentransformation
- Abschnitt 2: Techniken zur Datenbereinigung
- Lektion 4: Falsche und doppelte Daten
- Lektion 5: Datenausreißer
- Lektion 6: Unvollständige oder fehlende Daten
- Abschnitt 3: Kategoriale Kodierungstechniken
- Lektion 7: Kategoriale Kodierung
- Lektion 8: Kodierungstechniken
- Abschnitt 4: Feature Engineering
- Lektion 9: Feature-Engineering-Konzepte
- Lektion 10: Numerisches Feature-Engineering
- Lektion 11: Feature Engineering von Text
- Lektion 12: Techniken zur Feature-Auswahl
- Abschnitt 5: AWS-Tools und -Services für die Datentransformation
- Lektion 13: Datenkennzeichnung mit AWS
- Lektion 14: Datenaufnahme mit AWS
- Lektion 15: Datentransformation mit AWS
- Lektion 16: Daten mithilfe von AWS Glue transformieren
- Abschnitt 6: Fazit
- Lektion 17: Zusammenfassung des Kurses
- Lektion 18: Bewertung
- Lektion 19: Kontaktiere uns