Este curso aborda parte de la fase de preparación de datos del ciclo de vida del machine learning (ML). En este curso, aprenderá sobre la transformación de datos. En este curso, veremos varios conceptos y técnicas de transformación, como la limpieza de datos, la codificación y la ingeniería de características. Descubrirá cómo usar los servicios de Amazon Web Services (AWS), como el almacén de características de Amazon SageMaker, Amazon SageMaker Data Wrangler y AWS Glue, con el fin de transformar sus datos.
- Nivel del curso: avanzado
- Duración: 60 minutos
Actividades
- Materiales en línea
- Una demostración
- Preguntas de evaluación de conocimientos
- Una evaluación del curso
Objetivos del curso
- Explicar el valor de la limpieza y la transformación de datos
- Describir cómo procesar datos incorrectos o duplicados
- Describir cómo detectar y abordar valores atípicos
- Describir cómo procesar valores que faltan
- Describir las técnicas de codificación básicas
- Identificar los casos prácticos de la ingeniería de características
- Describir los conceptos, los beneficios y las técnicas fundamentales de la ingeniería de características
- Describir las técnicas de selección de características fundamentales
- Describir los servicios de AWS para validar y etiquetar datos
- Identificar las herramientas y los servicios de AWS para visualizar y transformar datos
- Describir cómo ingerir datos y administrar las características mediante el almacén de características de SageMaker
- Describir cómo ingerir y transformar datos con el uso de Amazon SageMaker Data Wrangler
- Describir cómo transformar los datos mediante AWS Glue
- Identificar las herramientas y los servicios de AWS para transformar la transmisión de datos
- Describir cómo transformar la transmisión de datos con AWS Lambda y Apache Spark en Amazon EMR
Audiencia objetivo
- Arquitectos de la nube
- Ingenieros de machine learning
Habilidades recomendadas
- Al menos 1 año de experiencia en el uso de Amazon SageMaker y otros servicios de AWS para la ingeniería de ML.
- Al menos 1 año de experiencia en un puesto relacionado, como desarrollador de software de backend, desarrollador de DevOps, ingeniero de datos o científico de datos.
- Una comprensión básica de los lenguajes de programación como Python.
- Cursos anteriores del plan de aprendizaje AWS ML Engineer Associate.
Esquema del curso
- Sección 1: introducción
- Lección 1: cómo utilizar este curso
- Lección 2: información general sobre el curso
- Lección 3: aspectos básicos de la transformación de datos
- Sección 2: técnicas de limpieza de datos
- Lección 4: datos incorrectos y duplicados
- Lección 5: valores atípicos de datos
- Lección 6: datos incompletos o faltantes
- Sección 3: técnicas de codificación categórica
- Lección 7: codificación categórica
- Lección 8: técnicas de codificación
- Sección 4: ingeniería de características
- Lección 9: conceptos de la ingeniería de características
- Lección 10: ingeniería de características numéricas
- Lección 11: ingeniería de características de texto
- Lección 12: técnicas de selección de características
- Sección 5: herramientas y servicios de AWS para la transformación de datos
- Lección 13: etiquetado de datos con AWS
- Lección 14: ingesta de datos con AWS
- Lección 15: transformación de datos con AWS
- Lección 16: transformación de datos con AWS Glue
- Sección 6: conclusión
- Lección 17: resumen del curso
- Lección 18: evaluación
- Lección 19: contáctenos