En este curso, se aborda parte de la fase de preparación de datos del ciclo de vida del machine learning (ML). Aquí aprenderá los aspectos básicos de los datos, incluido cómo reconocer los tipos de datos, cómo diferenciar los datos eficaces de los ineficaces y cómo visualizar y analizar datos. Obtendrá información sobre algunos de los principales productos de almacenamiento de Amazon Web Services (AWS) que se utilizan durante el proceso del ML, como Amazon Simple Storage Service (Amazon S3). En este curso, se explica cómo elegir el formato de datos y la opción de almacenamiento de AWS más eficaces en función de sus necesidades específicas de ML. Por último, obtendrá más información sobre algunos servicios de AWS que ayudan a ingerir, extraer y fusionar datos, como Amazon Kinesis.

Nivel del curso: avanzado
Duración: 60 minutos

Actividades

Materiales en línea
Una demostración
Preguntas de evaluación de conocimientos
Una evaluación del curso

Objetivos del curso

describir los aspectos básicos de la recopilación de datos,
definir los formatos de datos y los mecanismos de ingesta,
describir los diferentes métodos de visualización de datos,
diferenciar las opciones de almacenamiento de AWS para la recopilación de datos de ML, incluidos los casos prácticos y las ventajas y desventajas,
elegir la opción de almacenamiento más eficaz en función del costo, el rendimiento y la estructura de datos,
seleccionar el formato de datos adecuado para una tarea de ML en función de los patrones de acceso a los datos,
describir los orígenes de datos de streaming de AWS para la ingesta de datos,
extraer datos de los productos de almacenamiento de AWS con los productos de AWS que asisten en la transferencia de datos,
explicar cómo se combinan los datos de diversos orígenes,
identificar la causa de los problemas de ingesta y almacenamiento de datos relacionados con la capacidad y la escalabilidad.

Destinatarios

arquitectos de la nube,
ingenieros de machine learning.

Habilidades recomendadas

Al menos un año de experiencia en el uso de Amazon SageMaker y otros productos de AWS para la ingeniería de ML.
Al menos un año de experiencia en un puesto relacionado, como desarrollador de software de backend, desarrollador de DevOps, ingeniero de datos o científico de datos.
Una comprensión básica de los lenguajes de programación, como Python.
Cursos anteriores del programa de aprendizaje de AWS para ingenieros de ML asociados.

Esquema del curso

Sección 1: Introducción

Lección 1: Cómo utilizar este curso
Lección 2: Introducción al dominio n.º 1
Lección 3: Información general sobre el curso
Lección 4: Aspectos básicos de la recopilación de datos

Sección 2: Recopilación de datos

Lección 5: Tipos de datos
Lección 6: Visualización y análisis exploratorio de los datos

Sección 3: Orígenes de datos y productos de AWS

Lección 7: Opciones de almacenamiento de AWS
Lección 8: Elección del almacenamiento

Sección 4: Ingesta, extracción y fusión de datos

Lección 9: Ingesta de datos
Lección 10: Extracción de datos
Lección 11: Fusión de datos
Lección 12: Resolución de problemas relacionados con la ingesta y el almacenamiento de datos