En este curso, se cubre una parte de la fase de preparación de datos del ciclo de vida del machine learning (ML). En este curso, aprenderás sobre los fundamentos de datos, incluido cómo reconocer los tipos de datos, diferenciar los datos efectivos de los no efectivos y visualizar y analizar los datos. Obtendrás información sobre algunos de los principales servicios de almacenamiento de Amazon Web Services (AWS) que se usan durante el proceso de ML, como Amazon Simple Storage Service (Amazon S3). En este curso, se explica cómo elegir el formato de datos y la decisión de almacenamiento de AWS más eficaces en función de las necesidades específicas de ML. Por último, obtendrás más información sobre algunos servicios de AWS que ayudan a ingerir, extraer y combinar datos, como Amazon Kinesis.

Nivel del curso: avanzado
Duración: 60 minutos

Actividades

Materiales en línea
Una demostración
Preguntas de la prueba de conocimientos
Una evaluación del curso

Objetivos del curso

Describir los fundamentos de la recopilación de datos.
Definir los formatos de datos y los mecanismos de ingesta.
Describir los diferentes métodos para visualizar los datos.
Describir las opciones de almacenamiento de AWS para la recopilación de datos de ML, incluidos los casos prácticos y las ventajas y desventajas.
Elegir la decisión de almacenamiento más eficaz en función del coste, el rendimiento y la estructura de datos.
Elegir el formato de datos adecuado para una tarea de ML en función de los patrones de acceso a los datos.
Describir los orígenes de datos de streaming de AWS para la ingesta de datos.
Extraer datos de los servicios de almacenamiento de AWS mediante los servicios de AWS que ayudan en la transferencia de datos.
Describir cómo combinar datos de varios orígenes.
Identificar la causa de los problemas de ingesta y almacenamiento de datos relacionados con la capacidad y la escalabilidad.

Público objetivo

Arquitectos de la nube
Ingenieros de machine learning

Habilidades recomendadas

Al menos 1 año de experiencia en el uso de Amazon SageMaker y otros servicios de AWS para la ingeniería de ML.
Al menos 1 año de experiencia en un puesto relacionado, como desarrollador de software de backend, desarrollador de DevOps, ingeniero de datos o científico de datos.
Una comprensión fundamental de los lenguajes de programación como Python.
Cursos anteriores del plan de formación intermedio de ingenieros de machine learning de AWS.