Build a Serverless Text-to-Speech Application with Amazon Polly (Italiano)

Amazon Web Services and Amazon via AWS Skill Builder

Go to class Write review

A partire dal 28 marzo, i titoli dei corsi saranno solo in inglese. Tuttavia, le descrizioni dei corsi rimarranno disponibili nella tua lingua preferita per consentirti di effettuare ricerche in questa lingua.

Panoramica del laboratorio

In generale, la sintesi vocale non è semplice. Non si può dare per scontato che, quando un’applicazione legge ogni lettera della frase, il risultato avrà senso. Le principali problematiche delle applicazioni di sintesi vocale includono:

Parole che si scrivono nello stesso modo, ma si pronunciano in maniera diversa, ad esempio in inglese: I live in Las Vegas (Vivo a Las Vegas) e This presentation broadcasts live from Las Vegas (Questa presentazione trasmette live da Las Vegas).
Normalizzazione del testo: disambiguazione di abbreviazioni, acronimi e unità: St., che può indicare sia Street (strada, via) che Saint (Santo/a).
Conversione del testo in fonemi di lingue con mappature complesse, come l’inglese, ad esempio tough, through e though. In questo esempio, parti simili di parole diverse possono essere pronunciate in modo diverso a seconda della parola e del contesto.
Parole (déjà vu), nomi propri (François Hollande) e acronimi (ASAP, LOL) in lingua straniera.

Amazon Polly fornisce funzionalità di sintesi vocale che permettono di risolvere questi problemi, consentendo di concentrare le energie sulla creazione delle applicazioni di sintesi vocale anziché sulla risoluzione dei problemi di interpretazione.

Amazon Polly converte il testo in voce naturale. Ti permette di creare applicazioni che parlano in maniera naturale, sviluppando categorie completamente nuove di prodotti con funzionalità vocali. Amazon Polly è un servizio Amazon AI che utilizza tecnologie avanzate di apprendimento approfondito per sintetizzare una voce che assomiglia a quella umana. Attualmente include decine tipi di voce naturale e supporta 20 lingue per permettere di selezionare la voce più adatta e distribuire le proprie applicazioni dotate di funzionalità vocali in diversi mercati.

Inoltre, Amazon Polly offre i tempi di risposta rapidi e costanti necessari per supportare dialoghi interattivi in tempo reale. Puoi memorizzare nella cache e salvare i file audio di Polly per riprodurli o ridistribuirli offline. In altre parole, i file che converti e salvi sono tuoi. Non ci sono costi aggiuntivi per l’utilizzo della sintesi vocale. Polly è anche facile da usare. Basta inviare all’API di Amazon Polly il testo che vuoi convertire in voce e Amazon Polly restituisce immediatamente alla tua applicazione un flusso audio che può essere riprodotto direttamente o memorizzato in un formato di file audio standard, come MP3.

In questa esercitazione di laboratorio creerai un’applicazione serverless di base che utilizza Amazon Polly per convertire il testo in voce. L’applicazione ha un’interfaccia semplice che accetta il testo in molte lingue diverse e lo converte in file audio riproducibili da un browser web. Questo laboratorio utilizza dei post di un blog, ma tu puoi utilizzare qualsiasi tipo di testo. Ad esempio, puoi utilizzare l’applicazione per leggere le ricette mentre prepari un piatto, oppure un articolo di giornale o un libro mentre guidi l’auto o vai in bicicletta.

Obiettivi

Alla fine di questa esercitazione di laboratorio dovresti essere in grado di:

Creare una tabella di Amazon DynamoDB per archiviare i dati
Creare un’API RESTful tramite il Gateway Amazon API
Creare funzioni AWS Lambda attivate dal gateway API
Collegare le funzioni AWS Lambda con Amazon Simple Notification Service (SNS)
Utilizzare Amazon Polly per sintetizzare la voce in lingue e con voci diverse

Legenda icone

In questo laboratorio vengono utilizzate varie icone per richiamare l’attenzione su diversi tipi di istruzioni e note. Nell’elenco seguente viene illustrato lo scopo di ciascuna di esse:

Comando: un comando da eseguire.
Output previsto: un output di esempio che puoi utilizzare per verificare l’output di un comando o di un file modificato.
Nota: una nota, un suggerimento o indicazioni importanti.
Attenzione: informazioni di particolare interesse o importanza, non così importanti da causare problemi alle apparecchiature o ai dati se non si rispettano, ma che potrebbero comportare la necessità di ripetere determinati passaggi.
Avviso: un’azione irreversibile e che potrebbe provocare la mancata esecuzione di un comando o di un processo. Include avvisi su configurazioni che sarà impossibile modificare dopo l’esecuzione.
Attività completata: una conclusione o un punto riepilogativo del laboratorio.