Ce cours couvre une partie de la phase de préparation des données du cycle de vie de l'apprentissage automatique (ML). Dans ce cours, vous découvrirez les principes fondamentaux des données, notamment comment reconnaître les types de données, différencier les données efficaces des données inefficaces et visualiser et analyser les données. Vous découvrirez certains des principaux services de stockage Amazon Web Services (AWS) utilisés pendant le processus de machine learning, tels qu'Amazon Simple Storage Service (Amazon S3). Ce cours explique comment prendre la meilleure décision de stockage et choisir le format de données AWS le plus adapté à vos besoins spécifiques en matière de machine learning. Enfin, vous en apprendrez plus sur certains services AWS qui permettent d'ingérer, d'extraire et de fusionner des données, comme Amazon Kinesis.
- Niveau du cours : avancé
- Durée : 60 minutes
Activités
- Documents en ligne
- Une démonstration
- Questions de vérification des connaissances
- Une évaluation du cours
Objectifs du cours
- Décrire les principes fondamentaux de la collecte de données.
- Définir les formats de données et les mécanismes d'ingestion.
- Décrire les différentes méthodes de visualisation des données.
- Décrire les options de stockage AWS pour la collecte de données ML, y compris les cas d'utilisation et les compromis.
- Choisir la décision de stockage la plus efficace en fonction des coûts, des performances et de la structure des données.
- Choisir le format de données approprié pour une tâche de machine learning en fonction des modèles d'accès aux données.
- Décrire les sources de données de streaming AWS pour l'ingestion de données.
- Extraire les données des services de stockage AWS en utilisant les services AWS qui facilitent le transfert de données.
- Décrire comment fusionner des données provenant de plusieurs sources.
- Identifier la cause des problèmes d'ingestion et de stockage des données liés à la capacité de mise à l'échelle.
Public visé
- Architectes cloud
- Ingénieurs Machine Learning
Compétences recommandées
- Au moins 1 an d'expérience dans l'utilisation d'Amazon SageMaker et d'autres services AWS pour l'ingénierie ML.
- Au moins 1 an d'expérience dans un poste connexe tel que développeur de logiciels backend, développeur DevOps, ingénieur de données ou Data Scientist.
- Compréhension fondamentale des langages de programmation tels que Python.
- Cours précédents du programme d'apprentissage AWS ML Engineer Associate.
Déroulement du cours
- Section 1 : Introduction
- Leçon 1 : comment utiliser ce cours
- Leçon 2 : Introduction au domaine 1
- Leçon 3 : Aperçu du cours
- Leçon 4 : Principes fondamentaux de la collecte de données
- Section 2 : Collecte de données
- Leçon 5 : Types de données
- Leçon 6 : Visualisation des données et analyse exploratoire des données
- Section 3 : Sources de données et services AWS
- Leçon 7 : Options de stockage AWS
- Leçon 8 : Choisir le stockage
- Section 4 : Ingérer, extraire et fusionner des données
- Leçon 9 : Ingestion de données
- Leçon 10 : Extraction de données
- Leçon 11 : Fusion de données
- Leçon 12 : Résolution des problèmes liés à l'ingestion et au stockage des données
- Section 5 : Conclusion
- Leçon 13 : Résumé du cours
- Leçon 14 : Évaluation
- Leçon 15 : Nous contacter
Mots-clés
- Gen AI
- IA générative