Ce cours couvre une partie de la phase de préparation des données du cycle de vie de l'apprentissage automatique (ML). Dans ce cours, vous découvrirez les principes fondamentaux des données, notamment comment reconnaître les types de données, différencier les données efficaces des données inefficaces et visualiser et analyser les données. Vous découvrirez certains des principaux services de stockage Amazon Web Services (AWS) utilisés pendant le processus de machine learning, tels qu'Amazon Simple Storage Service (Amazon S3). Ce cours explique comment prendre la meilleure décision de stockage et choisir le format de données AWS le plus adapté à vos besoins spécifiques en matière de machine learning. Enfin, vous en apprendrez plus sur certains services AWS qui permettent d'ingérer, d'extraire et de fusionner des données, comme Amazon Kinesis.

Niveau du cours : avancé
Durée : 60 minutes

Activités

Documents en ligne
Une démonstration
Questions de vérification des connaissances
Une évaluation du cours

Objectifs du cours

Décrire les principes fondamentaux de la collecte de données.
Définir les formats de données et les mécanismes d'ingestion.
Décrire les différentes méthodes de visualisation des données.
Décrire les options de stockage AWS pour la collecte de données ML, y compris les cas d'utilisation et les compromis.
Choisir la décision de stockage la plus efficace en fonction des coûts, des performances et de la structure des données.
Choisir le format de données approprié pour une tâche de machine learning en fonction des modèles d'accès aux données.
Décrire les sources de données de streaming AWS pour l'ingestion de données.
Extraire les données des services de stockage AWS en utilisant les services AWS qui facilitent le transfert de données.
Décrire comment fusionner des données provenant de plusieurs sources.
Identifier la cause des problèmes d'ingestion et de stockage des données liés à la capacité de mise à l'échelle.

Public visé

Architectes cloud
Ingénieurs Machine Learning

Compétences recommandées

Au moins 1 an d'expérience dans l'utilisation d'Amazon SageMaker et d'autres services AWS pour l'ingénierie ML.
Au moins 1 an d'expérience dans un poste connexe tel que développeur de logiciels backend, développeur DevOps, ingénieur de données ou Data Scientist.
Compréhension fondamentale des langages de programmation tels que Python.
Cours précédents du programme d'apprentissage AWS ML Engineer Associate.

Déroulement du cours

Section 1 : Introduction

Leçon 1 : comment utiliser ce cours
Leçon 2 : Introduction au domaine 1
Leçon 3 : Aperçu du cours
Leçon 4 : Principes fondamentaux de la collecte de données

Section 2 : Collecte de données

Leçon 5 : Types de données
Leçon 6 : Visualisation des données et analyse exploratoire des données

Section 3 : Sources de données et services AWS

Leçon 7 : Options de stockage AWS
Leçon 8 : Choisir le stockage

Section 4 : Ingérer, extraire et fusionner des données

Leçon 9 : Ingestion de données
Leçon 10 : Extraction de données
Leçon 11 : Fusion de données
Leçon 12 : Résolution des problèmes liés à l'ingestion et au stockage des données