Data Engineer, Big Data and ML on Google Cloud em Português
Google Cloud via Coursera Specialization
Overview
Coursera Flash Sale
40% Off Coursera Plus for 3 Months!
Grab it
Nesta especialização on-line intensiva de cinco semanas, os participantes terão uma introdução prática sobre como projetar e criar sistemas de processamento de dados no Google Cloud Platform. Por meio de uma combinação de apresentações, demonstrações e laboratórios práticos, os participantes aprenderão a projetar sistemas de processamento de dados, criar canais completos e análises de dados e desenvolver soluções de aprendizado de máquina. Neste curso, abordamos dados estruturados, não estruturados e de streaming.
Neste curso, os participantes irão adquirir as seguintes habilidades:
• projetar e criar sistemas de processamento de dados no Google Cloud Platform
• usar dados não estruturados com as APIs do Spark e de aprendizado de máquina no Cloud Dataproc
• processar dados em lote e streaming com a implementação de canais de dados de escalonamento automático no Cloud Dataflow
• derivar insights de negócios a partir de conjuntos de dados extremamente grandes usando o Google BigQuery
• treinar, avaliar e prever com modelos de aprendizado de máquina usando o TensorFlow e o Cloud ML
• ativar insights instantâneos dos dados de streaming
Esta aula destina-se a desenvolvedores experientes responsáveis pelo gerenciamento de transformações de Big Data.
>>> Ao se inscrever nesta especialização, você concorda com os Termos de Serviço do Qwiklabs conforme estabelecido na seção de perguntas frequentes. Veja os Termos de Serviço aqui: https://qwiklabs.com/terms_of_service
Syllabus
- Course 1: Como criar data lakes e data warehouses no Google Cloud
- Course 2: Como criar pipelines de dados em lote no Google Cloud
- Course 3: Como criar pipelines de dados de streaming no Google Cloud
- Course 4: Smart Analytics, Machine Learning, and AI on GCP em Português Brasileiro
Courses
-
Neste curso, apresentamos os produtos e serviços de Big Data e machine learning do Google Cloud que dão suporte ao ciclo de vida de dados para IA. Nele, você verá os processos, desafios e benefícios de criar um pipeline de Big Data e modelos de machine learning com a Vertex AI no Google Cloud.
-
A incorporação de machine learning em pipelines de dados aumenta a capacidade de extrair insights dessas informações. Neste curso, mostramos as várias formas de incluir essa tecnologia em pipelines de dados do Google Cloud. Para casos de pouca ou nenhuma personalização, vamos falar sobre o AutoML. Para usar recursos de machine learning mais personalizados, vamos apresentar os Notebooks e o machine learning do BigQuery (BigQuery ML). No curso, você também vai aprender sobre a produção de soluções de machine learning usando a Vertex AI.
-
Os dois principais componentes de um pipeline de dados são data lakes e warehouses. Neste curso, destacamos os casos de uso para cada tipo de armazenamento e as soluções de data lake e warehouse disponíveis no Google Cloud de forma detalhada e técnica. Além disso, também descrevemos o papel de um engenheiro de dados, os benefícios de um pipeline de dados funcional para operações comerciais e analisamos por que a engenharia de dados deve ser feita em um ambiente de nuvem. Este é o primeiro curso da série ""Data Engineering on Google Cloud"". Após a conclusão, recomendamos que você comece o curso ""Building Batch Data Pipelines on Google Cloud"".
-
"Neste curso intermediário, você aprenderá a projetar, criar e otimizar pipelines de dados em lote robustos no Google Cloud. Além do tratamento básico de dados, você vai aprender sobre transformações em grande escala e orquestração eficiente de fluxos de trabalho, essenciais para a eficiência em Business Intelligence e relatórios importantes. Pratique o uso do Dataflow para Apache Beam e do Serverless para Apache Spark (Dataproc sem servidor) na implementação e resolva questões importantes em qualidade de dados, monitoramento e alertas, garantindo um pipeline confiável e excelência operacional. Recomendamos ter conhecimento básico de armazenamento em data warehouse, ETL/ELT, SQL, Python e conceitos do Google Cloud."
-
O processamento de dados de streaming é cada vez mais usado pelas empresas para gerar métricas sobre as operações comerciais em tempo real. Neste curso, você vai aprender a criar pipelines de dados de streaming no Google Cloud. O Pub/Sub é apresentado como a ferramenta para gerenciar dados de streaming de entrada. No curso, também abordamos a aplicação de agregações e transformações a dados de streaming usando o Dataflow, além de formas de armazenar registros processados no BigQuery ou no Cloud Bigtable para análise. Os participantes vão ganhar experiência prática na criação de componentes de pipelines de dados de streaming no Google Cloud usando o Qwiklabs.
Taught by
Google Cloud Training