Data Engineering, Big Data and ML on Google Cloud en Español
Google Cloud via Coursera Specialization
Overview
Coursera Flash Sale
40% Off Coursera Plus for 3 Months!
Grab it
Especialización acelerada en línea de cinco semanas de duración, donde los participantes reciben una introducción práctica en el diseño y compilación de sistemas de procesamiento de datos en Google Cloud Platform. Usando una combinación de presentaciones, demostraciones y labs prácticos, los participantes aprenderán a diseñar sistemas de procesamiento de datos, compilar canalizaciones de datos de extremo a extremo, analizar datos y llevar a efecto funciones de aprendizaje automático. Este curso le enseñará las siguientes habilidades:
• Diseñar y crear sistemas de procesamiento de datos en Google Cloud Platform
• Aprovechar los datos no estructurados mediante Spark y las API de AA en Cloud Dataproc
• Procesar los datos por lotes y de transmisión mediante la implementación de canalizaciones de datos de ajuste de escala automático en Cloud Dataflow
• Generar estadísticas empresariales a partir de conjuntos de datos muy grandes mediante Google BigQuery
• Entrenar, evaluar y predecir por medio de los modelos de aprendizaje automático con Tensorflow y Cloud ML
• Extraer estadísticas al instante a partir de los datos de transmisión
Este curso está dirigido a desarrolladores experimentados responsables de la administración de transformaciones de macrodatos.
>>> Al inscribirse en esta especialización acepta los Términos de Servicio de Qwiklabs según lo establecido en las Preguntas Frecuentes, disponibles en el apartado: https://qwiklabs.com/terms_of_service
Syllabus
- Course 1: Crea data lakes y almacenes de datos en Google Cloud
- Course 2: Crea canalizaciones de datos por lotes en Google Cloud
- Course 3: Crea canalizaciones de datos de transmisión en Google Cloud
- Course 4: Smart Analytics, Machine Learning, and AI on GCP en Español
Courses
-
En este curso, aprenderás sobre los productos y servicios de macrodatos y aprendizaje automático de Google Cloud involucrados en el ciclo de vida de datos a IA. También explorarás los procesos, los desafíos y los beneficios de crear una canalización de macrodatos y modelos de aprendizaje automático con Vertex AI en Google Cloud.
-
La incorporación del aprendizaje automático en las canalizaciones de datos aumenta la capacidad para extraer estadísticas de los datos. En este curso, veremos formas de incluir el aprendizaje automático en las canalizaciones de datos en Google Cloud. Para una personalización escasa o nula, en el curso se aborda AutoML. Para obtener más capacidades de aprendizaje automático a medida, el curso presenta Notebooks y BigQuery Machine Learning (BigQuery ML). Además, en este curso se aborda cómo llevar a producción soluciones de aprendizaje automático con Vertex AI.
-
Las canalizaciones de datos suelen realizarse según uno de los paradigmas extracción y carga (EL); extracción, carga y transformación (ELT), o extracción, transformación y carga (ETL). En este curso, abordaremos qué paradigma se debe utilizar para los datos por lotes y cuándo corresponde usarlo. Además, veremos varias tecnologías de Google Cloud para la transformación de datos, incluidos BigQuery, la ejecución de Spark en Dataproc, grafos de canalización en Cloud Data Fusion y procesamiento de datos sin servidores en Dataflow. Los estudiantes obtienen experiencia práctica en la compilación de componentes de canalizaciones de datos en Google Cloud con Qwiklabs.
-
Si bien los enfoques tradicionales de usar data lakes y almacenes de datos pueden ser eficaces, tienen deficiencias, en particular en entornos empresariales grandes. En este curso, se presenta el concepto del data lakehouse y los productos de Google Cloud que se usan para crear uno. Una arquitectura de lakehouse usa fuentes de datos de estándares abiertos y combina las mejores funciones de los data lakes y los almacenes de datos, lo que aborda muchas de sus deficiencias.
-
En este curso, adquirirás experiencia práctica para superar los desafíos del mundo real que se presentan cuando se crean canalizaciones de datos de transmisión. El enfoque principal es administrar datos continuos y no delimitados con los productos de Google Cloud.
Taught by
Google Cloud Training