En este curso, se aborda parte de la fase de preparación de datos del ciclo de vida del machine learning (ML). Aquí aprenderá los aspectos básicos de los datos, incluido cómo reconocer los tipos de datos, cómo diferenciar los datos eficaces de los ineficaces y cómo visualizar y analizar datos. Obtendrá información sobre algunos de los principales productos de almacenamiento de Amazon Web Services (AWS) que se utilizan durante el proceso del ML, como Amazon Simple Storage Service (Amazon S3). En este curso, se explica cómo elegir el formato de datos y la opción de almacenamiento de AWS más eficaces en función de sus necesidades específicas de ML. Por último, obtendrá más información sobre algunos servicios de AWS que ayudan a ingerir, extraer y fusionar datos, como Amazon Kinesis.
- Nivel del curso: avanzado
- Duración: 60 minutos
Actividades
- Materiales en línea
- Una demostración
- Preguntas de evaluación de conocimientos
- Una evaluación del curso
Objetivos del curso
- describir los aspectos básicos de la recopilación de datos,
- definir los formatos de datos y los mecanismos de ingesta,
- describir los diferentes métodos de visualización de datos,
- diferenciar las opciones de almacenamiento de AWS para la recopilación de datos de ML, incluidos los casos prácticos y las ventajas y desventajas,
- elegir la opción de almacenamiento más eficaz en función del costo, el rendimiento y la estructura de datos,
- seleccionar el formato de datos adecuado para una tarea de ML en función de los patrones de acceso a los datos,
- describir los orígenes de datos de streaming de AWS para la ingesta de datos,
- extraer datos de los productos de almacenamiento de AWS con los productos de AWS que asisten en la transferencia de datos,
- explicar cómo se combinan los datos de diversos orígenes,
- identificar la causa de los problemas de ingesta y almacenamiento de datos relacionados con la capacidad y la escalabilidad.
Destinatarios
- arquitectos de la nube,
- ingenieros de machine learning.
Habilidades recomendadas
- Al menos un año de experiencia en el uso de Amazon SageMaker y otros productos de AWS para la ingeniería de ML.
- Al menos un año de experiencia en un puesto relacionado, como desarrollador de software de backend, desarrollador de DevOps, ingeniero de datos o científico de datos.
- Una comprensión básica de los lenguajes de programación, como Python.
- Cursos anteriores del programa de aprendizaje de AWS para ingenieros de ML asociados.
Esquema del curso
- Sección 1: Introducción
- Lección 1: Cómo utilizar este curso
- Lección 2: Introducción al dominio n.º 1
- Lección 3: Información general sobre el curso
- Lección 4: Aspectos básicos de la recopilación de datos
- Sección 2: Recopilación de datos
- Lección 5: Tipos de datos
- Lección 6: Visualización y análisis exploratorio de los datos
- Sección 3: Orígenes de datos y productos de AWS
- Lección 7: Opciones de almacenamiento de AWS
- Lección 8: Elección del almacenamiento
- Sección 4: Ingesta, extracción y fusión de datos
- Lección 9: Ingesta de datos
- Lección 10: Extracción de datos
- Lección 11: Fusión de datos
- Lección 12: Resolución de problemas relacionados con la ingesta y el almacenamiento de datos
- Sección 5: Conclusión
- Lección 13: Resumen del curso
- Lección 14: Evaluación
- Lección 15: Contáctenos
Palabras clave
- IA gen
- IA generativa