Overview
Coursera Flash Sale
40% Off Coursera Plus for 3 Months!
Grab it
Cette formation de spécialisation en ligne d'une durée de cinq semaines présente en pratique comment concevoir et développer des systèmes de traitement des données sur Google Cloud. À travers un ensemble de présentations, de démonstrations et d'ateliers pratiques, les participants apprennent à concevoir des systèmes de traitement de données, à créer des pipelines de données de bout en bout, à analyser des données et à exécuter des tâches de machine learning. Ce cours permet aux participants d'acquérir les compétences suivantes : • Concevoir et développer des systèmes de traitement de données sur Google Cloud Platform • Exploiter des données non structurées à l'aide de Spark et des API de ML sur Cloud Dataproc • Traiter des données par lot ou par flux en mettant en œuvre des pipelines de données d'autoscaling sur Cloud Dataflow • Obtenir des informations métier à partir de très grands ensembles de données à l'aide de Google BigQuery • Entraîner, évaluer et effectuer des prédictions à l'aide de modèles de machine learning avec TensorFlow et Cloud ML • Obtenir des insights immédiats à partir de données par flux Ce cours s'adresse aux développeurs expérimentés qui se chargent de réaliser des opérations de transformation du big data. En vous inscrivant à cette spécialisation vous acceptez les conditions d'utilisation de Qwiklabs décrites dans la FAQ et disponibles à l'adresse: https://qwiklabs.com/terms_of_service
Syllabus
Course 1: Google Cloud Big Data and Machine Learning Fundamentals en Français
- Offered by Google Cloud. Ce cours présente les produits et services Google Cloud pour le big data et le machine learning compatibles avec le ... Enroll for free.
Course 2: Modernizing Data Lakes and Data Warehouses with GCP en Français
- Offered by Google Cloud. Les lacs de données et les entrepôts de données sont les deux principaux composants des pipelines de données. Ce ... Enroll for free.
Course 3: Building Batch Data Pipelines on GCP en Français
- Offered by Google Cloud. Les pipelines de données s'inscrivent généralement dans l'un des paradigmes EL (extraction et chargement), ELT ... Enroll for free.
Course 4: Building Resilient Streaming Analytics Systems on GCP en Français
- Offered by Google Cloud. Le traitement de flux de données est une pratique de plus en plus courante, car elle permet aux entreprises ... Enroll for free.
Course 5: Smart Analytics, Machine Learning, and AI on GCP en Français
- Offered by Google Cloud. Intégrer le machine learning à des pipelines de données renforce la capacité à dégager des insights des données. Ce ... Enroll for free.
- Offered by Google Cloud. Ce cours présente les produits et services Google Cloud pour le big data et le machine learning compatibles avec le ... Enroll for free.
Course 2: Modernizing Data Lakes and Data Warehouses with GCP en Français
- Offered by Google Cloud. Les lacs de données et les entrepôts de données sont les deux principaux composants des pipelines de données. Ce ... Enroll for free.
Course 3: Building Batch Data Pipelines on GCP en Français
- Offered by Google Cloud. Les pipelines de données s'inscrivent généralement dans l'un des paradigmes EL (extraction et chargement), ELT ... Enroll for free.
Course 4: Building Resilient Streaming Analytics Systems on GCP en Français
- Offered by Google Cloud. Le traitement de flux de données est une pratique de plus en plus courante, car elle permet aux entreprises ... Enroll for free.
Course 5: Smart Analytics, Machine Learning, and AI on GCP en Français
- Offered by Google Cloud. Intégrer le machine learning à des pipelines de données renforce la capacité à dégager des insights des données. Ce ... Enroll for free.
Courses
-
Ce cours présente les produits et services Google Cloud pour le big data et le machine learning compatibles avec le cycle de vie "des données à l'IA". Il explore les processus, défis et avantages liés à la création d'un pipeline de big data et de modèles de machine learning avec Vertex AI sur Google Cloud.
-
Intégrer le machine learning à des pipelines de données renforce la capacité à dégager des insights des données. Ce cours passera en revue plusieurs façons d'intégrer le machine learning à des pipelines de données sur Google Cloud. Vous découvrirez AutoML pour les cas ne nécessitant que peu de personnalisation (voire aucune), ainsi que Notebooks et BigQuery ML pour les situations qui requièrent des capacités de machine learning plus adaptées. Enfin, vous apprendrez à utiliser des solutions de machine learning en production avec Vertex AI.
-
Bien que les approches traditionnelles utilisant des lacs de données et des entrepôts de données puissent être efficaces, elles présentent des inconvénients, en particulier dans les grands environnements d'entreprise. Ce cours présente le concept de data lakehouse et les produits Google Cloud utilisés pour en créer un. Une architecture de lakehouse utilise des sources de données basées sur des normes ouvertes et combine les meilleures fonctionnalités des lacs et des entrepôts de données, ce qui permet de pallier de nombreuses lacunes.
-
Dans ce cours de niveau intermédiaire, vous apprendrez à concevoir, créer et optimiser des pipelines de données en batch robustes sur Google Cloud. Au-delà des bases de la gestion des données, vous explorerez les transformations de données à grande échelle et l'orchestration efficace des workflows, essentielles pour l'informatique décisionnelle et les rapports critiques. Vous vous entraînerez à utiliser Dataflow pour Apache Beam et Serverless pour Apache Spark (Dataproc Serverless) pour l'implémentation, et vous aborderez des considérations importantes concernant la qualité des données, la surveillance et les alertes pour assurer la fiabilité des pipelines et l'excellence opérationnelle. Il est recommandé d'avoir des connaissances de base sur l'entreposage de données, les processus ETL/ELT, SQL, Python et les concepts de Google Cloud.
-
Dans ce cours, vous allez vous exercer à résoudre des problèmes concrets rencontrés lors de la création de pipelines de flux données. L'objectif principal est de gérer des données continues et illimitées avec les produits Google Cloud.
Taught by
Google Cloud Training