Build a Serverless Text-to-Speech Application with Amazon Polly (繁體中文)

Amazon Web Services and Amazon via AWS Skill Builder

Go to class Write review

實驗室概觀

一般而言，語音合成並不容易。您無法假設當應用程式讀取句子的每個字母時，輸出就會有意義。文字轉換語音應用程式的一些常見挑戰包括：

書寫方式相同但發音不同的字詞：I live in Las Vegas 和 This presentation broadcasts live from Las Vegas。
文字標準化：消除縮寫、首字母縮略字和單位的歧義：St.，可以展開為 Street 或 Saint。
在具有複雜映射的語言中，將文字轉換為音素，例如英文中的 tough、through 和 though。在此範例中，不同字詞的相似部分，可以根據字詞和上下文而有不同發音。
外文字詞 (déjà vu)、專有名詞 (François Hollande) 和俚語 (ASAP、LOL)。

Amazon Polly 提供可克服這些挑戰的語音合成功能，讓您可以專注於建置使用文字轉換語音的應用程式，而不用解決翻譯上的困難。

Amazon Polly 可將文字轉換成逼真的語音。它可讓您建立能夠自然說話的應用程式，藉此建立全新的語音式產品類別。Amazon Polly 是運用進階深度學習技術的 Amazon AI 服務，讓合成語音聽起來就像真人發音一樣。它目前包含超過 20 種語言的多種逼真語音，您可以選取最合適的語音來建立多國使用並啟用語音功能的應用程式。

此外，Amazon Polly 也提供一致、快速的回應時間，可支援即時互動對話。您可以快取並儲存 Polly 的語音檔案以進行離線重播或重新發布。(也就是說，您轉換與儲存的東西都是屬於您的。使用語音並不會加收額外文字轉換語音的費用。)Polly 也非常容易使用。您只需將要轉換為語音的文字傳送到 Amazon Polly API。Amazon Polly 就會立即將音訊串流傳回您的應用程式，應用程式便可以直接播放，或是以標準音訊檔案格式存放，例如 MP3。

在此實驗室中，您將建立一個使用 Amazon Polly 將文字轉換為語音的基本無伺服器應用程式。該應用程式具有簡單的使用者界面，可以接受多種不同語言的文字，然後將其轉換為可以從 Web 瀏覽器播放的音訊檔案。此實驗室使用部落格文章，但您可以使用任何類型的文字。例如，您可以在烹飪時使用應用程式來閱讀食譜，或者在開車或騎車時閱讀新聞文章或書籍。