Crea audio dal testo utilizzando la riga di comando
Questo documento ti guida nella procedura per presentare una richiesta a Text-to-Speech utilizzando la riga di comando. Per saperne di più sulle basi di Cloud Text-to-Speech, leggi Nozioni di base su Text-to-Speech.
Prima di iniziare
Prima di poter inviare una richiesta all'API Text-to-Speech, devi aver completato le azioni seguenti. Consulta le prima di iniziare per maggiori dettagli.
- Abilita Text-to-Speech in un progetto Google Cloud.
- Assicurati che la fatturazione sia abilitata per Text-to-Speech.
-
After Installing the Google Cloud CLI, configure the gcloud CLI to use your federated identity and then initialize it by running the following command:
gcloud init
Sintetizza audio dal testo
Puoi convertire il testo in audio effettuando una richiesta POST HTTP all'
Endpoint https://texttospeech.googleapis.com/v1/text:synthesize
. Nella
il corpo del comando POST, specifica il tipo di voce da sintetizzare
sezione di configurazione voice
, specifica il testo da sintetizzare nel
campo text
della sezione input
e specifica il tipo di audio da creare
nella sezione audioConfig
.
Esegui la richiesta REST riportata di seguito alla riga di comando per sintetizzare l'audio da testo utilizzando Text-to-Speech. Il comando utilizza
gcloud auth application-default print-access-token
per recuperare un'autorizzazione token per la richiesta.Prima di utilizzare i dati della richiesta, effettua le seguenti sostituzioni:
- PROJECT_ID: l'ID alfanumerico del tuo progetto Google Cloud.
Metodo HTTP e URL:
POST https://texttospeech.googleapis.com/v1/text:synthesize
Corpo JSON della richiesta:
{ "input": { "text": "Android is a mobile operating system developed by Google, based on the Linux kernel and designed primarily for touchscreen mobile devices such as smartphones and tablets." }, "voice": { "languageCode": "en-gb", "name": "en-GB-Standard-A", "ssmlGender": "FEMALE" }, "audioConfig": { "audioEncoding": "MP3" } }
Per inviare la richiesta, espandi una delle seguenti opzioni:
Dovresti ricevere una risposta JSON simile alla seguente:
{ "audioContent": "//NExAASCCIIAAhEAGAAEMW4kAYPnwwIKw/BBTpwTvB+IAxIfghUfW.." }
L'output JSON per il comando REST contiene l'audio sintetizzato in con codifica Base64. Copia i contenuti del campo
audioContent
in un nuovo file denominatosynthesize-output-base64.txt
. Il nuovo file avrà un aspetto simile ad esempio://NExAARqoIIAAhEuWAAAGNmBGMY4EBcxvABAXBPmPIAF//yAuh9Tn5CEap3/o ... VVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVV
Decodifica i contenuti del file
synthesize-output-base64.txt
in un nuovo file denominatosynthesized-audio.mp3
. Per informazioni sulla decodifica in base64, consulta Decodifica dei contenuti audio con codifica Base64.Linux
Copia solo i contenuti con codifica Base64 in un file di testo.
Decodifica il file di testo di origine utilizzando lo strumento a riga di comando base64 utilizzando il flag
-d
:
$ base64 SOURCE_BASE64_TEXT_FILE -d > DESTINATION_AUDIO_FILE
Mac OSX
Copia solo i contenuti con codifica Base64 in un file di testo.
Decodifica il file di testo di origine utilizzando lo strumento a riga di comando base64:
$ base64 --decode SOURCE_BASE64_TEXT_FILE > DESTINATION_AUDIO_FILE
Windows
Copia solo i contenuti con codifica Base64 in un file di testo.
Decodifica il file di testo di origine utilizzando il metodo Comando
certutil
.
certutil -decode SOURCE_BASE64_TEXT_FILE DESTINATION_AUDIO_FILE
Riproduci i contenuti di
synthesized-audio.mp3
in un'applicazione audio o su un dispositivo audio. Puoi anche apriresynthesized-audio.mp3
in Chrome browser per riprodurre l'audio andando alla cartella che contiene il file, ad esempiofile://my_file_path/synthesized-audio.mp3
Esegui la pulizia
Per evitare addebiti inutili per Google Cloud Platform, utilizza il metodo Console Google Cloud per eliminare il progetto se non ti serve.
Passaggi successivi
- Scopri di più su Cloud Text-to-Speech leggendo il di base.
- Esamina l'elenco di voci disponibili che puoi utilizzare per la sintesi vocale.