En este curso, se cubre una parte de la fase de preparación de datos del ciclo de vida del machine learning (ML). En este curso, aprenderás sobre los fundamentos de datos, incluido cómo reconocer los tipos de datos, diferenciar los datos efectivos de los no efectivos y visualizar y analizar los datos. Obtendrás información sobre algunos de los principales servicios de almacenamiento de Amazon Web Services (AWS) que se usan durante el proceso de ML, como Amazon Simple Storage Service (Amazon S3). En este curso, se explica cómo elegir el formato de datos y la decisión de almacenamiento de AWS más eficaces en función de las necesidades específicas de ML. Por último, obtendrás más información sobre algunos servicios de AWS que ayudan a ingerir, extraer y combinar datos, como Amazon Kinesis.
- Nivel del curso: avanzado
- Duración: 60 minutos
Actividades
- Materiales en línea
- Una demostración
- Preguntas de la prueba de conocimientos
- Una evaluación del curso
Objetivos del curso
- Describir los fundamentos de la recopilación de datos.
- Definir los formatos de datos y los mecanismos de ingesta.
- Describir los diferentes métodos para visualizar los datos.
- Describir las opciones de almacenamiento de AWS para la recopilación de datos de ML, incluidos los casos prácticos y las ventajas y desventajas.
- Elegir la decisión de almacenamiento más eficaz en función del coste, el rendimiento y la estructura de datos.
- Elegir el formato de datos adecuado para una tarea de ML en función de los patrones de acceso a los datos.
- Describir los orígenes de datos de streaming de AWS para la ingesta de datos.
- Extraer datos de los servicios de almacenamiento de AWS mediante los servicios de AWS que ayudan en la transferencia de datos.
- Describir cómo combinar datos de varios orígenes.
- Identificar la causa de los problemas de ingesta y almacenamiento de datos relacionados con la capacidad y la escalabilidad.
Público objetivo
- Arquitectos de la nube
- Ingenieros de machine learning
Habilidades recomendadas
- Al menos 1 año de experiencia en el uso de Amazon SageMaker y otros servicios de AWS para la ingeniería de ML.
- Al menos 1 año de experiencia en un puesto relacionado, como desarrollador de software de backend, desarrollador de DevOps, ingeniero de datos o científico de datos.
- Una comprensión fundamental de los lenguajes de programación como Python.
- Cursos anteriores del plan de formación intermedio de ingenieros de machine learning de AWS.
Esquema del curso
- Sección 1: Introducción
- Lección 1: Cómo usar este curso
- Lección 2: Introducción al dominio 1
- Lección 3: Información general del curso
- Lección 4: Fundamentos de la recopilación de datos
- Sección 2: Recopilación de datos
- Lección 5: Tipos de datos
- Lección 6: Visualización de datos y análisis exploratorio de datos
- Sección 3: Orígenes de datos y servicios de AWS
- Lección 7: Opciones de almacenamiento de AWS
- Lección 8: Elección del almacenamiento
- Sección 4: Ingerir, extraer y combinar datos
- Lección 9: Ingesta de datos
- Lección 10: Extracción de datos
- Lección 11: Combinación de datos
- Lección 12: Solución de problemas de ingesta y almacenamiento de datos
- Sección 5: Conclusión
- Lección 13: Resumen del curso
- Lección 14: Evaluación
- Lección 15: Contactar con nosotros
Palabras clave
- IA generativa
- IA generativa