Questo tutorial illustra come usare il linguaggio SSML (Speech Synthesis Markup Language) per far parlare un file di testo di indirizzi. Puoi eseguire il markup di una stringa di testo con i tag SSML per personalizzare l'audio sintetico di Text-to-Speech.
Testo normale | Rendering SSML del testo non criptato |
---|---|
123 Street Ln |
<speak>123 Street Ln</speak> |
1 Number St |
<speak>1 Number St</speak> |
1 Piazza del Fibonacci |
<speak>1 Piazza del Fibonacci</speak> |
Obiettivo
Invia una richiesta di sintesi vocale a Text-to-Speech utilizzando SSML e le librerie client Text-to-Speech.
Costi
Per informazioni sui costi, consulta la pagina dei prezzi di Text-to-Speech.
Prima di iniziare
- Assicurati di avere un progetto di sintesi vocale nella console Google Cloud.
- Questo tutorial ti consente di utilizzare Java, Node.js o Python. Se prevedi di utilizzare Java, scarica e installa Maven. Se prevedi di utilizzare Node.js, scarica npm.
Scarica gli esempi di codice
Per scaricare gli esempi di codice, clona gli esempi di GitHub di Google Cloud per il linguaggio di programmazione che intendi utilizzare.
Java
Questo tutorial utilizza il codice nella directory texttospeech/cloud-client/src/main/java/com/example/texttospeech/
del repository di esempi Java della piattaforma Google Cloud.
Per scaricare e accedere al codice di questo tutorial, esegui i seguenti comandi dal terminale.
git clone https://github.com/GoogleCloudPlatform/java-docs-samples.git cd java-docs-samples/texttospeech/cloud-client/src/main/java/com/example/texttospeech/
Node.js
Questo tutorial utilizza il codice nella directory texttospeech
del
repository di esempi Node.js della piattaforma Google Cloud.
Per scaricare e accedere al codice di questo tutorial, esegui i seguenti comandi dal terminale.
git clone https://github.com/GoogleCloudPlatform/nodejs-docs-samples.git cd texttospeech/
Python
Questo tutorial utilizza il codice nella directory texttospeech/snippets
del repository di esempi Python della piattaforma Google Cloud.
Per scaricare e accedere al codice di questo tutorial, esegui i seguenti comandi dal terminale.
git clone https://github.com/GoogleCloudPlatform/python-docs-samples.git cd samples/snippets
installa la libreria client
Questo tutorial utilizza la libreria client Text-to-Speech.
Java
Questo tutorial utilizza le seguenti dipendenze.
Node.js
Dal terminale, esegui il seguente comando.
npm install @google-cloud/text-to-speech
Python
Dal terminale, esegui il seguente comando.
pip install --upgrade google-cloud-texttospeech
Configura le credenziali della Google Cloud Platform
Provide authentication credentials to your application code by setting the
environment variable GOOGLE_APPLICATION_CREDENTIALS
. This
variable applies only to your current shell session. If you want the variable
to apply to future shell sessions, set the variable in your shell startup file,
for example in the ~/.bashrc
or ~/.profile
file.
Linux o macOS
export GOOGLE_APPLICATION_CREDENTIALS="KEY_PATH
"
Replace KEY_PATH
with the path of the JSON file that contains your credentials.
For example:
export GOOGLE_APPLICATION_CREDENTIALS="/home/user/Downloads/service-account-file.json"
Windows
For PowerShell:
$env:GOOGLE_APPLICATION_CREDENTIALS="KEY_PATH
"
Replace KEY_PATH
with the path of the JSON file that contains your credentials.
For example:
$env:GOOGLE_APPLICATION_CREDENTIALS="C:\Users\username\Downloads\service-account-file.json"
For command prompt:
set GOOGLE_APPLICATION_CREDENTIALS=KEY_PATH
Replace KEY_PATH
with the path of the JSON file that contains your credentials.
Importare librerie
Questo tutorial utilizza le seguenti librerie client e di sistema.
Java
Per scoprire come installare e utilizzare la libreria client per Text-to-Speech, consulta Librerie client Text-to-Speech. Per ulteriori informazioni, consulta la documentazione di riferimento dell'API Text-to-Speech Java.
Per autenticarti a Text-to-Speech, configura le Credenziali predefinite dell'applicazione. Per maggiori informazioni, consulta Configurare l'autenticazione per un ambiente di sviluppo locale.
Node.js
Per scoprire come installare e utilizzare la libreria client per Text-to-Speech, consulta Librerie client Text-to-Speech. Per ulteriori informazioni, consulta la documentazione di riferimento dell'API Text-to-Speech Node.js.
Per autenticarti a Text-to-Speech, configura le Credenziali predefinite dell'applicazione. Per maggiori informazioni, consulta Configurare l'autenticazione per un ambiente di sviluppo locale.
Python
Per scoprire come installare e utilizzare la libreria client per Text-to-Speech, consulta Librerie client Text-to-Speech. Per ulteriori informazioni, consulta la documentazione di riferimento dell'API Text-to-Speech Python.
Per autenticarti a Text-to-Speech, configura le Credenziali predefinite dell'applicazione. Per maggiori informazioni, consulta Configurare l'autenticazione per un ambiente di sviluppo locale.
Utilizzare l'API Text-to-Speech
La seguente funzione prende una stringa di testo con tagging SSML e il nome di un file MP3. La funzione utilizza il testo taggato con SSML per generare audio sintetico. La funzione salva l'audio sintetico nel nome del file MP3 designato come parametro.
L'intero input SSML può essere letto solo da una singola voce.
Puoi impostare la voce nell'oggetto
VoiceSelectionParams
.
Java
Per scoprire come installare e utilizzare la libreria client per Text-to-Speech, consulta Librerie client Text-to-Speech. Per ulteriori informazioni, consulta la documentazione di riferimento dell'API Text-to-Speech Java.
Per autenticarti a Text-to-Speech, configura le Credenziali predefinite dell'applicazione. Per maggiori informazioni, consulta Configurare l'autenticazione per un ambiente di sviluppo locale.
Node.js
Per scoprire come installare e utilizzare la libreria client per Text-to-Speech, consulta Librerie client Text-to-Speech. Per ulteriori informazioni, consulta la documentazione di riferimento dell'API Text-to-Speech Node.js.
Per autenticarti a Text-to-Speech, configura le Credenziali predefinite dell'applicazione. Per maggiori informazioni, consulta Configurare l'autenticazione per un ambiente di sviluppo locale.
Python
Per scoprire come installare e utilizzare la libreria client per Text-to-Speech, consulta Librerie client Text-to-Speech. Per ulteriori informazioni, consulta la documentazione di riferimento dell'API Text-to-Speech Python.
Per autenticarti a Text-to-Speech, configura le Credenziali predefinite dell'applicazione. Per maggiori informazioni, consulta Configurare l'autenticazione per un ambiente di sviluppo locale.
Personalizzare l'audio sintetico
La seguente funzione prende il nome di un file di testo e converte i contenuti del file in una stringa di testo con tagging SSML.
Java
Per scoprire come installare e utilizzare la libreria client per Text-to-Speech, consulta Librerie client Text-to-Speech. Per ulteriori informazioni, consulta la documentazione di riferimento dell'API Text-to-Speech Java.
Per autenticarti a Text-to-Speech, configura le Credenziali predefinite dell'applicazione. Per maggiori informazioni, consulta Configurare l'autenticazione per un ambiente di sviluppo locale.
Node.js
Per scoprire come installare e utilizzare la libreria client per Text-to-Speech, consulta Librerie client Text-to-Speech. Per ulteriori informazioni, consulta la documentazione di riferimento dell'API Text-to-Speech Node.js.
Per autenticarti a Text-to-Speech, configura le Credenziali predefinite dell'applicazione. Per maggiori informazioni, consulta Configurare l'autenticazione per un ambiente di sviluppo locale.
Python
Per scoprire come installare e utilizzare la libreria client per Text-to-Speech, consulta Librerie client Text-to-Speech. Per ulteriori informazioni, consulta la documentazione di riferimento dell'API Text-to-Speech Python.
Per autenticarti a Text-to-Speech, configura le Credenziali predefinite dell'applicazione. Per maggiori informazioni, consulta Configurare l'autenticazione per un ambiente di sviluppo locale.
Riassumendo
Questo programma utilizza i seguenti input.
123 Street Ln, Small Town, IL 12345 USA 1 Jenny St & Number St, Tutone City, CA 86753 1 Piazza del Fibonacci, 12358 Pisa, Italy
Se passi il testo riportato sopra a text_to_ssml()
, viene generato il seguente testo con tag.
<speak>123 Street Ln, Small Town, IL 12345 USA <break time="2s"/>1 Jenny St & Number St, Tutone City, CA 86753 <break time="2s"/>1 Piazza del Fibonacci, 12358 Pisa, Italy <break time="2s"/></speak>
Esegui il codice
Per generare un file audio di parlato sintetico, esegui il seguente codice dalla riga di comando.
Java
Linux o macOS
Dalla directory java-docs-samples/texttospeech/cloud-client/
,
esegui il seguente comando nella riga di comando.
$ mvn clean package
Windows
Dalla directory java-docs-samples/texttospeech/cloud-client/
,
esegui il seguente comando nella riga di comando.
$ mvn clean package
Node.js
Linux o macOS
Nel file hybridGlossaries.js
, riattiva le variabili TODO (developer)
Commentate.
Nel comando seguente, sostituisci projectId con il tuo ID progetto Google Cloud.
Dalla directory nodejs-docs-samples/texttospeech
,
esegui il seguente comando nella riga di comando.
$ node ssmlAddresses.js projectId
Windows
Nel file hybridGlossaries.js
, riattiva le variabili TODO (developer)
Commentate.
Nel comando seguente, sostituisci projectId con il tuo ID progetto Google Cloud.
Dalla directory nodejs-docs-samples/texttospeech
,
esegui il seguente comando nella riga di comando.
$env: C:/Node.js/node.exe C: ssmlAddresses.js projectId
Python
Linux o macOS
Dalla directory python-docs-samples/texttospeech/snippets
,
esegui il seguente comando nella riga di comando.
$ python ssml_addresses.py
Windows
Dalla directory python-docs-samples/texttospeech/snippets
,
esegui il seguente comando nella riga di comando.
$env: C:/Python3/python.exe C: ssml_addresses.py
Controlla l'output
Questo programma genera un file audio example.mp3 di parlato sintetico.
Java
Vai alla directory java-docs-samples/texttospeech/cloud-client/resources/
.
Controlla se nella directory resources
è presente un file example.mp3.
Node.js
Vai alla directory nodejs-docs-samples/texttospeech/resources/
.
Controlla se nella directory resources
è presente un file example.mp3.
Python
Vai a python-docs-samples/texttospeech/snippets/resources
.
Controlla se nella directory resources
è presente un file example.mp3.
Ascolta il seguente clip audio per verificare che il tuo file example.mp3 abbia lo stesso suono.
Risoluzione dei problemi
Se dimentichi di impostare la variabile di ambiente GOOGLE_APPLICATION_CREDENTIALS nella riga di comando, viene generato il messaggio di errore:
The Application Default Credentials are not available.
Se a
text_to_ssml()
viene passato il nome di un file inesistente, viene generato il messaggio di errore:IOError: [Errno 2] No such file or directory
Se passi a
ssml_to_audio()
un parametro ssml_text contenente None, viene generato il messaggio di errore:InvalidArgument: 400 Invalid input type. Type has to be text or SSML
Assicurati di eseguire il codice dalla directory corretta.
Passaggi successivi
- Esplora altri tag di SMIL.
- Scopri come utilizzare SSML con Traduzione e Visione
Esegui la pulizia
Per evitare che al tuo account Google Cloud Platform vengano addebitati costi relativi alle risorse utilizzate in questo tutorial, utilizza la console Google Cloud per eliminare il progetto se non ti serve.
Elimina il progetto
- Nella console Google Cloud, vai alla pagina Progetti.
- Nell'elenco dei progetti, seleziona il progetto che vuoi eliminare e fai clic su Elimina.
- Nella finestra di dialogo, digita l'ID progetto e fai clic su Chiudi per eliminare il progetto.