Data Engineer, Big Data and ML on Google Cloud auf Deutsch
Google Cloud via Coursera Specialization
-
32
-
- Write review
Overview
Google, IBM & Meta Certificates — All 10,000+ Courses at 40% Off
One annual plan covers every course and certificate on Coursera. 40% off for a limited time.
Get Full Access
Dieser fünfwöchige Onlinevertiefungskurs bietet eine praktische Einführung zum Entwerfen und Erstellen von Datenverarbeitungssystemen auf der Google Cloud Platform. In Präsentationen, Demos und praxisorientierten Labs entwickeln die Teilnehmer Datenverarbeitungssysteme, erstellen End-to-End-Datenpipelines, analysieren Daten und üben maschinelles Lernen. Dieser Kurs vermittelt den Teilnehmern die folgenden Kompetenzen:
• Datenverarbeitungssysteme auf der Google Cloud Platform entwickeln
• Unstrukturierte Daten mit Spark und ML-APIs auf Cloud Dataproc verwenden
• Batch- und Streaming-Daten durch die Implementierung von Autoscaling-Datenpipelines auf Cloud Dataflow verarbeiten
• Mit Google BigQuery Geschäftsinformationen aus extrem großen Datasets ableiten
• Modelle des maschinellen Lernens mit TensorFlow und Cloud ML trainieren, auswerten und damit Vorhersagen treffen
• Sofortige Statistiken aus Streaming-Daten ermöglichen
• Dieser Kurs richtet sich an erfahrene Entwickler, die für die Verwaltung von Big Data-Transformationen verantwortlich sind, zum Beispiel:
• Daten extrahieren, laden, transformieren, bereinigen und validieren
• Pipelines und Architekturen für die Datenverarbeitung entwerfen
• Modelle des maschinellen Lernens und der Statistik erstellen und warten
• Datasets abfragen, Abfrageergebnisse visualisieren und Berichte erstellen
>>> Mit Ihrer Teilnahme an dieser Spezialisierung stimmen Sie den Nutzungsbedingungen von Qwiklabs zu, die Sie in den FAQs und unter folgendem Link finden: https://qwiklabs.com/terms_of_service
Syllabus
- Course 1: Build Data Lakes and Data Warehouses on Google Cloud
- Course 2: Build Batch Data Pipelines on Google Cloud
- Course 3: Build Streaming Data Pipelines on Google Cloud
- Course 4: Smart Analytics, Machine Learning, and AI on Google Cloud
Courses
-
This course introduces the Google Cloud big data and machine learning products and services that support the data-to-AI lifecycle. It explores the processes, challenges, and benefits of building a big data pipeline and machine learning models with Vertex AI on Google Cloud.
-
In this course you will get hands-on in order to work through real-world challenges faced when building streaming data pipelines. The primary focus is on managing continuous, unbounded data with Google Cloud products.
-
Incorporating machine learning into data pipelines increases the ability to extract insights from data. This course covers ways machine learning can be included in data pipelines on Google Cloud. For little to no customization, this course covers AutoML. For more tailored machine learning capabilities, this course introduces Notebooks and BigQuery machine learning (BigQuery ML). Also, this course covers how to productionalize machine learning solutions by using Vertex AI.
-
The two key components of any data pipeline are data lakes and warehouses. This course highlights use-cases for each type of storage and dives into the available data lake and warehouse solutions on Google Cloud in technical detail. Also, this course describes the role of a data engineer, the benefits of a successful data pipeline to business operations, and examines why data engineering should be done in a cloud environment. This is the first course of the Data Engineering on Google Cloud series. After completing this course, enroll in the Building Batch Data Pipelines on Google Cloud course.
-
In this intermediate course, you will learn to design, build, and optimize robust batch data pipelines on Google Cloud. Moving beyond fundamental data handling, you will explore large-scale data transformations and efficient workflow orchestration, essential for timely business intelligence and critical reporting. Get hands-on practice using Dataflow for Apache Beam and Serverless for Apache Spark (Dataproc Serverless) for implementation, and tackle crucial considerations for data quality, monitoring, and alerting to ensure pipeline reliability and operational excellence. A basic knowledge of data warehousing, ETL/ELT, SQL, Python, and Google Cloud concepts is recommended.
Taught by
Google Cloud Training