このコースは、データ分析のニーズに合わせた BigQuery の使用方法について学習したいと考えているデータ アナリストを対象としています。動画、ラボ、デモを組み合わせることにより、BigQuery でデータを取り込み、変換し、クエリを実行してビジネス上の意思決定に役立つ分析情報を引き出す方法について、さまざまなトピックを取り上げます。
Overview
Syllabus
- コースの概要
- このモジュールでは、コースのアジェンダを紹介します。
- データ アナリストのための BigQuery
- 最初のモジュールでは、データ アナリストが直面している分析の課題を確認し、オンプレミスと Google Cloud のビッグデータを比較します。次に、Google Cloud のエンタープライズ データ ウェアハウスである BigQuery について説明し、データ分析のニーズに最適な BigQuery の機能を確認します。最後に、Google Cloud での分析を通して変革を実現した企業の実際のユースケースを見ていきます。
- BigQuery を使用したデータの探索と準備
- このモジュールでは、SQL(構造化クエリ言語)を使用してデータを探索する方法について学びます。簡単な SELECT 文から始めて、さまざまなデータセットを探索できる複雑なクエリへと学習を進めます。
- データのクリーニングと変換
- このモジュールでは、データの完全性に関する原則を説明し、その後、SQL を使用してデータをクリーニング、準備、変換する方法を見ていきます。モジュールの最後のセクションでは、データの準備と変換をサポートする他のプロダクト(Dataprep、Cloud Data Fusion、Dataflow、Dataproc、Dataform)についても簡単に紹介します。
- 新しい BigQuery データセットの取り込みと保存
- このモジュールでは、データを BigQuery のネイティブ ストレージに取り込み、保存する方法について説明します。データを BigQuery に読み込む際に、抽出 / 読み込み、抽出 / 読み込み / 変換、抽出 / 変換 / 読み込みのアプローチをそれぞれいつ使用すべきかについて検討します。また、外部データソース(データが BigQuery 外部でホストされている場合でも、BigQuery から直接クエリできるデータソース)にも触れます。
- BigQuery から得られた分析情報の可視化
- このモジュールでは、データの取り込み、クリーニング、準備、変換という一連の作業を経てついに、データから得られた有益な分析情報を、洞察に富んだダッシュボードやレポートとして可視化します。まず、可視化の理論とベスト プラクティスについて簡単に説明したうえで、BigQuery に接続して、分析情報を取得して伝えるための効果的な可視化を作成できる Looker Studio やコネクテッド シートなどのツールをご紹介します。SQL は強力なクエリ言語ですが、Python、Java、R などのプログラミング言語では、特定の種類のデータ分析に役立つ使いやすい構文や、さまざまな組み込みの統計関数が提供されています。このモジュールでは、そうしたツールの一種である Jupyter Notebook などのオープンソースのウェブベースのアプリケーションについても説明します。
- Dataform を使った BigQuery でのスケーラブルなデータ変換パイプラインの開発
- SQL パイプラインの作成、管理、バージョニングは非常に手間がかかります。多くの場合、データ アナリストはこれを行うために複数のツールを使用しなければなりません。そこで、このモジュールでは、BigQuery で SQL パイプラインの開発、バージョン管理、オーケストレーションを一元的に行う新しいプロダクト Dataform を紹介します。
- BigQuery Studio
- このモジュールでは、まず BigQuery Studio の概要と、その開発に至った背景について解説します。次に、BigQuery Studio に搭載されている優れた機能について詳しく説明します。最後に、デモを通して魅力的な機能を紹介し、その使い方を解説してモジュールを締めくくります。
- まとめ
- このモジュールでは、コースで扱った主要なトピックについて復習します。
Taught by
Google Cloud Training