Class Central is learner-supported. When you buy through links on our site, we may earn an affiliate commission.

Amazon Web Services

Build a Serverless Text-to-Speech Application with Amazon Polly (Bahasa Indonesia)

Amazon Web Services and Amazon via AWS Skill Builder

Overview

Coursera Flash Sale
40% Off Coursera Plus for 3 Months!
Grab it

Gambaran umum lab

Secara umum, sintesis ucapan tidaklah mudah. Anda tidak dapat berasumsi bahwa ketika sebuah aplikasi membaca setiap huruf dari sebuah kalimat, output-nya akan masuk akal. Beberapa tantangan umum untuk aplikasi teks-ke-ucapan meliputi:

  • Kata-kata yang ditulis dengan cara yang sama, tetapi pengucapannya berbeda: I live in Las Vegas dibandingkan dengan This presentation broadcasts live from Las Vegas.
  • Normalisasi teks: Singkatan, akronim, dan unit yang tidak ambigu: St., yang dapat berarti Street atau Saint.
  • Mengonversi teks ke fonem dalam bahasa dengan pemetaan kompleks, seperti dalam bahasa Inggris, tough, through, dan though. Dalam contoh ini, bagian yang mirip dari kata yang berbeda dapat diucapkan secara berbeda tergantung kata dan konteksnya.
  • Kata asing (déjà vu), nama orang (François Hollande), dan slang (ASAP, LOL).

Amazon Polly mempermudah pembuatan aplikasi yang menggunakan teks-ke-ucapan dengan menyediakan fitur sintesis suara sehingga Anda dapat fokus pada pengembangan tanpa harus mengatasi kesulitan interpretasi.

Amazon Polly mengubah teks-ke-ucapan yang realistis. Ini memungkinkan Anda membuat aplikasi yang berbicara secara alami, memungkinkan Anda membuat kategori produk yang sepenuhnya baru dengan kemampuan bicara. Amazon Polly adalah layanan AI Amazon yang menggunakan teknologi deep learning canggih untuk menyintesis ucapan yang terdengar seperti suara manusia. Saat ini terdapat lusinan suara yang mirip aslinya dalam lebih dari 20 bahasa, sehingga Anda dapat memilih suara yang ideal dan membuat aplikasi yang mendukung ucapan yang berfungsi di banyak negara berbeda.

Selain itu, Amazon Polly memberikan waktu respons cepat secara konsisten yang diperlukan untuk mendukung dialog interaktif real-time. Anda dapat men-cache dan menyimpan file audio Polly untuk pemutaran ulang atau redistribusi secara luring. Dengan kata lain, apa yang Anda konversi dan simpan adalah milik Anda. Tidak ada biaya teks-ke-ucapan tambahan untuk menggunakan ucapan tersebut. Polly juga mudah digunakan. Anda cukup mengirim teks yang ingin Anda ubah menjadi ucapan ke Amazon Polly API. Amazon Polly segera mengembalikan stream audio ke aplikasi sehingga aplikasi Anda dapat memutarnya secara langsung atau menyimpannya dalam format file audio standar seperti MP3.

Di lab ini, Anda membuat aplikasi dasar nirserver yang menggunakan Amazon Polly untuk mengonversi teks-ke-ucapan. Aplikasi ini memiliki antarmuka pengguna yang sederhana yang menerima teks dalam berbagai bahasa, kemudian mengubahnya menjadi file audio yang dapat Anda putar dari browser web. Lab ini menggunakan posting blog, tetapi Anda dapat menggunakan semua jenis teks. Misalnya, Anda dapat menggunakan aplikasi untuk membaca resep saat Anda menyiapkan makanan, atau artikel berita atau buku saat mengemudi atau mengendarai sepeda.

Tujuan

Di akhir lab ini, Anda akan mampu:

  • Membuat tabel Amazon DynamoDB untuk menyimpan data
  • Membuat API RESTful Amazon API Gateway
  • Membuat fungsi AWS Lambda yang dipicu oleh API Gateway
  • Menghubungkan fungsi AWS Lambda dengan Amazon Simple Notification Service (SNS)
  • Menggunakan Amazon Polly untuk menyintesis ucapan dalam berbagai bahasa dan suara

Kunci ikon

Beragam ikon digunakan di seluruh lab ini untuk menarik perhatian kepada berbagai tipe petunjuk dan catatan. Daftar berikut menjelaskan tujuan setiap ikon:

  • Command: (Perintah) perintah yang harus Anda jalankan.
  • Output yang diharapkan: Output sampel yang dapat Anda gunakan untuk memverifikasi output dari perintah atau file yang diedit.
  • Catatan: Petunjuk, tip, atau panduan penting.
  • Perhatian: Informasi dengan kepentingan khusus (tidak terlalu penting untuk menyebabkan masalah terkait peralatan atau data jika Anda melewatkannya, tetapi dapat mengakibatkan pengulangan langkah-langkah tertentu).
  • Peringatan: Tindakan yang tidak dapat dibatalkan dan dapat berpotensi memengaruhi kegagalan perintah atau proses (termasuk peringatan tentang konfigurasi yang tidak dapat diubah setelah dibuat).
  • Tugas selesai: Poin kesimpulan atau ringkasan dalam lab.

Reviews

Start your review of Build a Serverless Text-to-Speech Application with Amazon Polly (Bahasa Indonesia)

Never Stop Learning.

Get personalized course recommendations, track subjects and courses with reminders, and more.

Someone learning on their laptop while sitting on the floor.