Amazon EMR は、業界をリードするクラウドビッグデータソリューションで、Apache Spark、Apache Hive、Presto などのオープンソースフレームワークを使用して、ペタバイト規模のデータ処理、インタラクティブ分析、機械学習を行います。Amazon EMR を使用すると、ビッグデータ環境の設定、運用、スケーリングを行ったり、キャパシティーのプロビジョニングなどの時間のかかるタスクを自動化することができます。
このコースでは、Amazon EMR の新しいオプションである Amazon EMR Serverless について学びます。これを使用すると、オープンソースのビッグデータフレームワークを使用して構築されたアプリケーションを効率的かつコスト効率の高い方法で実行できます。データエンジニアやアナリストは、クラスターの調整、運用、最適化、保護、管理を行う必要はありません。さらに、Amazon EMR の利点、一般的なユースケース、および技術的概念についても学習します。AWS マネジメントコンソールを使用したチュートリアルを通じて、Amazon EMR Serverless と Amazon EMR クラスターを試すことができます。
- コースレベル: 基礎
- 所要時間: 1 時間
コースの目標
このコースには、プレゼンテーション、グラフィック、チュートリアルのほか、これを理解するための任意のデモが含まれます。
コースの目標
このコースでは、以下の内容を学習します。
- Amazon EMR で利用できるさまざまなデプロイオプションを理解する。
- Amazon EMR の仕組みを理解する。
- Amazon EMR Serverless の技術的概念を理解する。
- Amazon EMR Serverless の一般的なユースケースをリストアップする。
- Amazon EMR クラスターの技術的概念を理解する。
- Amazon EMR クラスターの一般的なユースケースをリストアップする。
- 実際のシナリオで Amazon EMR を実装する際に必要なことを特定する。
- Amazon EMR の利点を理解する。
- Amazon EMR のコスト構造を説明する。
- Amazon EMR Serverless と Amazon EMR クラスターを使用する。
コースの対象者
このコースは次のような方を対象としています。
- デベロッパー
- ソリューションアーキテクト
- データエンジニア
- データアーキテクト
前提条件
AWS Technical Essentials (Japanese)
Fundamentals of Analytics on AWS – Part 1 (Japanese)
Fundamentals of Analytics on AWS – Part 2 (Japanese)
コースの概要
はじめに
- Amazon EMR の概論
- Amazon EMR Serverless のアーキテクチャとユースケース
- Amazon EMR クラスターのアーキテクチャとユースケース
Amazon EMR Serverless の使用
- Amazon EMR Serverless で Spark ジョブを実行する方法
Amazon EMR の使用
- EC2 クラスターで Amazon EMR を作成する方法
- Amazon EMR Studio を作成する方法
- Amazon EMR Workspace を作成する方法
- Amazon EMR Studio ノートブックで Spark ジョブを実行する方法
リソース
- 詳細情報