Questo tutorial dimostra come utilizzare lo Speech Synthesis Markup Language (SSML). pronunciare un file di testo di indirizzi. Puoi eseguire il markup di una stringa di testo con SSML tag per personalizzare l'audio sintetico da Text-to-Speech.
Testo normale | Rendering SSML del testo non criptato |
---|---|
123 Street Ln |
<speak>123 Street Ln</speak> |
1 Number St |
<speak>1 Number St</speak> |
1 Piazza del Fibonacci |
<speak>1 Piazza del Fibonacci</speak> |
Obiettivo
Invia una richiesta di sintesi vocale a Text-to-Speech utilizzando SSML e le librerie client Text-to-Speech.
Costi
Per informazioni sui costi, consulta la pagina dei prezzi di Text-to-Speech.
Prima di iniziare
- Assicurati di avere un progetto di sintesi vocale nella console Google Cloud.
- Questo tutorial ti consente di utilizzare Java, Node.js o Python. Se prevedi di utilizzare Java, scarica e installa Maven. Se prevedi di utilizzare Node.js, scarica npm.
Scarica gli esempi di codice
Per scaricare gli esempi di codice, clona quelli di Google Cloud GitHub per il linguaggio di programmazione che intendi utilizzare.
Java
Questo tutorial utilizza il codice nella directory texttospeech/cloud-client/src/main/java/com/example/texttospeech/
del repository di esempi Java della piattaforma Google Cloud.
Per scaricare e andare al codice di questo tutorial, esegui questi comandi
dal terminale.
git clone https://github.com/GoogleCloudPlatform/java-docs-samples.git cd java-docs-samples/texttospeech/cloud-client/src/main/java/com/example/texttospeech/
Node.js
Questo tutorial utilizza il codice in texttospeech
directory del
Repository di esempi Node.js della piattaforma Google Cloud.
Per scaricare e accedere al codice di questo tutorial, esegui i seguenti comandi dal terminale.
git clone https://github.com/GoogleCloudPlatform/nodejs-docs-samples.git cd texttospeech/
Python
Questo tutorial utilizza il codice nella directory texttospeech/snippets
del repository di esempi Python della piattaforma Google Cloud.
Per scaricare e accedere al codice di questo tutorial, esegui i seguenti comandi dal terminale.
git clone https://github.com/GoogleCloudPlatform/python-docs-samples.git cd samples/snippets
installa la libreria client
Questo tutorial utilizza la libreria client Text-to-Speech.
Java
Questo tutorial utilizza le seguenti dipendenze.
Node.js
Dal terminale, esegui il comando seguente.
npm install @google-cloud/text-to-speech
Python
Dal terminale, esegui il comando seguente.
pip install --upgrade google-cloud-texttospeech
Configurare le credenziali di Google Cloud Platform
Provide authentication credentials to your application code by setting the
environment variable GOOGLE_APPLICATION_CREDENTIALS
. This
variable applies only to your current shell session. If you want the variable
to apply to future shell sessions, set the variable in your shell startup file,
for example in the ~/.bashrc
or ~/.profile
file.
Linux o macOS
export GOOGLE_APPLICATION_CREDENTIALS="KEY_PATH
"
Replace KEY_PATH
with the path of the JSON file that contains your credentials.
For example:
export GOOGLE_APPLICATION_CREDENTIALS="/home/user/Downloads/service-account-file.json"
Windows
For PowerShell:
$env:GOOGLE_APPLICATION_CREDENTIALS="KEY_PATH
"
Replace KEY_PATH
with the path of the JSON file that contains your credentials.
For example:
$env:GOOGLE_APPLICATION_CREDENTIALS="C:\Users\username\Downloads\service-account-file.json"
For command prompt:
set GOOGLE_APPLICATION_CREDENTIALS=KEY_PATH
Replace KEY_PATH
with the path of the JSON file that contains your credentials.
Importare librerie
Questo tutorial utilizza le seguenti librerie di sistema e client.
Java
Per scoprire come installare e utilizzare la libreria client per Text-to-Speech, vedi Librerie client di Text-to-Speech. Per ulteriori informazioni, consulta la documentazione di riferimento dell'API Text-to-Speech Java.
Per autenticarti a Text-to-Speech, configura Credenziali predefinite dell'applicazione. Per maggiori informazioni, consulta Configurare l'autenticazione per un ambiente di sviluppo locale.
Node.js
Per scoprire come installare e utilizzare la libreria client per Text-to-Speech, vedi Librerie client di Text-to-Speech. Per ulteriori informazioni, consulta la documentazione di riferimento dell'API Text-to-Speech Node.js.
Per autenticarti a Text-to-Speech, configura Credenziali predefinite dell'applicazione. Per ulteriori informazioni, vedi Configura l'autenticazione per un ambiente di sviluppo locale.
Python
Per scoprire come installare e utilizzare la libreria client per Text-to-Speech, vedi Librerie client di Text-to-Speech. Per ulteriori informazioni, consulta API Python di Text-to-Speech documentazione di riferimento.
Per autenticarti a Text-to-Speech, configura Credenziali predefinite dell'applicazione. Per ulteriori informazioni, vedi Configura l'autenticazione per un ambiente di sviluppo locale.
Utilizzare l'API Text-to-Speech
La seguente funzione prende un stringa di testo con SSML e il nome di un file MP3. La funzione utilizza il testo taggato con SSML per generare audio sintetico. La funzione salva l'audio sintetico nel nome del file MP3 designato come parametro.
L'intero input SSML può essere letto solo da una singola voce.
Puoi impostare la voce nella
VoiceSelectionParams
.
Java
Per scoprire come installare e utilizzare la libreria client per Text-to-Speech, vedi Librerie client di Text-to-Speech. Per ulteriori informazioni, consulta la documentazione di riferimento dell'API Text-to-Speech Java.
Per autenticarti a Text-to-Speech, configura Credenziali predefinite dell'applicazione. Per maggiori informazioni, consulta Configurare l'autenticazione per un ambiente di sviluppo locale.
Node.js
Per scoprire come installare e utilizzare la libreria client per Text-to-Speech, vedi Librerie client di Text-to-Speech. Per ulteriori informazioni, consulta la documentazione di riferimento dell'API Text-to-Speech Node.js.
Per autenticarti a Text-to-Speech, configura le credenziali predefinite dell'applicazione. Per ulteriori informazioni, vedi Configura l'autenticazione per un ambiente di sviluppo locale.
Python
Per scoprire come installare e utilizzare la libreria client per Text-to-Speech, vedi Librerie client di Text-to-Speech. Per ulteriori informazioni, consulta API Python di Text-to-Speech documentazione di riferimento.
Per autenticarti a Text-to-Speech, configura le credenziali predefinite dell'applicazione. Per ulteriori informazioni, vedi Configura l'autenticazione per un ambiente di sviluppo locale.
Personalizza l'audio sintetico
La seguente funzione prende il nome di un file di testo e converte i contenuti del file in una stringa di testo con tagging SSML.
Java
Per scoprire come installare e utilizzare la libreria client per Text-to-Speech, vedi Librerie client di Text-to-Speech. Per ulteriori informazioni, consulta la documentazione di riferimento dell'API Text-to-Speech Java.
Per autenticarti a Text-to-Speech, configura Credenziali predefinite dell'applicazione. Per ulteriori informazioni, vedi Configura l'autenticazione per un ambiente di sviluppo locale.
Node.js
Per scoprire come installare e utilizzare la libreria client per Text-to-Speech, vedi Librerie client di Text-to-Speech. Per ulteriori informazioni, consulta API Node.js di Text-to-Speech documentazione di riferimento.
Per autenticarti a Text-to-Speech, configura le credenziali predefinite dell'applicazione. Per ulteriori informazioni, vedi Configura l'autenticazione per un ambiente di sviluppo locale.
Python
Per scoprire come installare e utilizzare la libreria client per Text-to-Speech, vedi Librerie client di Text-to-Speech. Per ulteriori informazioni, consulta la documentazione di riferimento dell'API Text-to-Speech Python.
Per autenticarti a Text-to-Speech, configura le credenziali predefinite dell'applicazione. Per ulteriori informazioni, vedi Configura l'autenticazione per un ambiente di sviluppo locale.
Riassumendo
Questo programma utilizza il seguente input.
123 Street Ln, Small Town, IL 12345 USA 1 Jenny St & Number St, Tutone City, CA 86753 1 Piazza del Fibonacci, 12358 Pisa, Italy
Se passi il testo precedente a text_to_ssml()
, viene generato il seguente testo con tag.
<speak>123 Street Ln, Small Town, IL 12345 USA <break time="2s"/>1 Jenny St & Number St, Tutone City, CA 86753 <break time="2s"/>1 Piazza del Fibonacci, 12358 Pisa, Italy <break time="2s"/></speak>
Esegui il codice
Per generare un file audio di sintesi vocale, esegui il seguente codice dalla riga di comando.
Java
Linux o MacOS
Dalla directory java-docs-samples/texttospeech/cloud-client/
,
esegui questo comando sulla riga di comando.
$ mvn clean package
Windows
Dalla directory java-docs-samples/texttospeech/cloud-client/
,
esegui questo comando sulla riga di comando.
$ mvn clean package
Node.js
Linux o macOS
Nel file hybridGlossaries.js
, rimuovi il commento da TODO (developer)
con le variabili con commenti commentato.
Nel comando seguente, sostituisci projectId con il tuo ID progetto Google Cloud.
Dalla directory nodejs-docs-samples/texttospeech
,
esegui questo comando sulla riga di comando.
$ node ssmlAddresses.js projectId
Windows
Nel file hybridGlossaries.js
, rimuovi il commento da TODO (developer)
con le variabili con commenti commentato.
Nel comando seguente, sostituisci projectId con il tuo ID progetto Google Cloud.
Dalla directory nodejs-docs-samples/texttospeech
,
esegui questo comando sulla riga di comando.
$env: C:/Node.js/node.exe C: ssmlAddresses.js projectId
Python
Linux o MacOS
Dalla directory python-docs-samples/texttospeech/snippets
,
esegui questo comando sulla riga di comando.
$ python ssml_addresses.py
Windows
Dalla directory python-docs-samples/texttospeech/snippets
,
esegui questo comando sulla riga di comando.
$env: C:/Python3/python.exe C: ssml_addresses.py
Controlla l'output
Questo programma genera un file audio example.mp3 di parlato sintetico.
Java
Vai alla directory java-docs-samples/texttospeech/cloud-client/resources/
.
Controlla se nella directory resources
è presente un file example.mp3.
Node.js
Vai alla directory nodejs-docs-samples/texttospeech/resources/
.
Controlla se nella directory resources
è presente un file example.mp3.
Python
Vai a python-docs-samples/texttospeech/snippets/resources
.
Controlla se nella directory resources
è presente un file example.mp3.
Ascolta il seguente clip audio per verificare che il tuo file example.mp3 abbia lo stesso suono.
Risoluzione dei problemi
Hai dimenticato di impostare GOOGLE_APPLICATION_CREDENTIALS di variabile di ambiente nella riga di comando genera il messaggio di errore:
The Application Default Credentials are not available.
Passando
text_to_ssml()
il nome di un file inesistente, viene generato il messaggio di errore:IOError: [Errno 2] No such file or directory
Se passi a
ssml_to_audio()
un parametro ssml_text contenente None, viene generato il messaggio di errore:InvalidArgument: 400 Invalid input type. Type has to be text or SSML
Assicurati di eseguire il codice dalla directory corretta.
Passaggi successivi
- Esplora altri tag SSML.
- Scopri come utilizzare SSML con Traduzione e Visione
Esegui la pulizia
Per evitare che al tuo account Google Cloud Platform vengano addebitati costi relativi alla usate in questo tutorial, usa la console Google Cloud per eliminare il progetto se non ti serve.
Elimina il progetto
- Nella console Google Cloud, vai alla pagina Progetti.
- Nell'elenco dei progetti, seleziona il progetto che vuoi eliminare e fai clic su Elimina.
- Nella finestra di dialogo, digita l'ID progetto e fai clic su Chiudi per eliminare il progetto.