Class Central is learner-supported. When you buy through links on our site, we may earn an affiliate commission.

Google Cloud

Google Cloud에서 일괄 데이터 파이프라인 빌드하기

Google Cloud via Coursera

Overview

Coursera Flash Sale
40% Off Coursera Plus for 3 Months!
Grab it
이 중급 과정에서는 Google Cloud에서 강력한 일괄 데이터 파이프라인을 설계, 빌드, 최적화하는 방법을 알아봅니다. 기본적인 데이터 처리를 넘어, 시의적절한 비즈니스 인텔리전스와 중요한 보고에 필수적인 대규모 데이터 변환과 효율적인 워크플로 조정에 대해 살펴봅니다. Apache Beam용 Dataflow와 Apache Spark용 서버리스(Dataproc Serverless)를 사용하여 구현을 실습하고, 파이프라인 안정성과 운영 우수성을 보장하기 위해 데이터 품질, 모니터링, 알림에 대한 중요한 고려사항을 다룹니다. 데이터 웨어하우징, ETL/ELT, SQL, Python, Google Cloud 개념에 대한 기본적인 지식이 있으면 좋습니다.

Syllabus

  • 일괄 데이터 파이프라인을 선택해야 하는 경우
    • 일괄 데이터 파이프라인을 개발하고 유지관리하는 데 있어 데이터 엔지니어의 중요한 역할을 배우고, 핵심 구성요소와 수명 주기를 이해하며, 일괄 데이터 처리의 일반적인 과제를 분석합니다. 또한 이러한 과제를 해결하는 데 도움이 되는 주요 Google Cloud 서비스를 파악합니다.
  • 일괄 데이터 파이프라인 설계 및 빌드
    • 대용량 데이터 수집 및 변환을 위해 확장 가능한 일괄 데이터 파이프라인을 설계합니다. 또한 높은 처리량과 비용 효율성을 위해 다양한 리소스 관리 및 성능 조정 기법을 사용하여 일괄 작업을 최적화합니다.
  • 일괄 데이터 파이프라인의 데이터 품질 관리
    • 일괄 파이프라인 내에서 데이터 품질을 보장하기 위해 데이터 검증 규칙과 정리 로직을 개발합니다. 또한 대규모 데이터 세트에서 스키마 변경을 관리하고 데이터 중복 삭제를 수행하기 위한 전략을 구현합니다.
  • 일괄 데이터 파이프라인 조정 및 모니터링
    • 효율적인 일정 예약 및 계보 추적을 위해 복잡한 일괄 데이터 파이프라인 워크플로를 조정합니다. 또한 일괄 데이터 파이프라인에 대하여 강력한 오류 처리, 모니터링, 모니터링 가능성을 구현합니다.

Taught by

Google Cloud Training

Reviews

Start your review of Google Cloud에서 일괄 데이터 파이프라인 빌드하기

Never Stop Learning.

Get personalized course recommendations, track subjects and courses with reminders, and more.

Someone learning on their laptop while sitting on the floor.