Questa pagina descrive come attivare il riconoscimento della lingua per le richieste di trascrizione audio inviate a Speech-to-Text.
In alcuni casi, non conosci con certezza la lingua presente nelle tue registrazioni audio. Ad esempio, se pubblichi il tuo servizio, la tua app o il tuo prodotto in un paese con più lingue ufficiali, potresti ricevere input audio da utenti in diverse lingue. Ciò può rendere molto più difficile specificare un codice lingua per le richieste di trascrizione.
Riconoscimento di più lingue
Speech-to-Text consente di specificare un insieme di lingue alternative che potrebbero essere contenute nei tuoi dati audio. Quando invii una richiesta di trascrizione audio a Speech-to-Text, puoi fornire un elenco di lingue aggiuntive che potrebbero essere incluse nei dati audio. Se includi un elenco di lingue nella richiesta, Speech-to-Text tenta di trascrivere l'audio in base alla lingua più adatta al campione tra le alternative fornite. Speech-to-Text etichetta quindi i risultati della trascrizione con il codice lingua previsto.
Questa funzione è ideale per le app che devono trascrivere frasi brevi come comandi vocali o ricerche. Puoi elencare fino a tre lingue alternative, tra quelle supportate da Speech-to-Text oltre alla tua lingua principale (per un totale di quattro lingue).
Anche se puoi specificare lingue alternative per la tua richiesta di trascrizione vocale, devi comunque fornire un codice lingua principale nel campo languageCode
. Inoltre, dovresti limitare al minimo il numero
di lingue richieste. Meno codici di lingua alternativi richiesti consentono a Speech-to-Text di selezionare correttamente quella corretta. Specificare un solo linguaggio
per ottenere risultati ottimali.
Attiva il riconoscimento della lingua nelle richieste di trascrizione audio
Per specificare lingue alternative nella trascrizione audio, devi impostare il campo alternativeLanguageCodes
su un elenco di codici lingua nei parametri RecognitionConfig
della richiesta. Speech-to-Text supporta i codici lingua alternativi per tutti i metodi di riconoscimento vocale: speech:recognize
, speech:longrunningrecognize
e Streaming.
Utilizza un file locale
Protocollo
Per informazioni dettagliate, fai riferimento all'endpoint API
speech:recognize
.
Per eseguire il riconoscimento vocale sincrono, effettua una richiesta POST
e fornisci il corpo della richiesta appropriato. Di seguito è riportato un esempio di richiesta POST
che utilizza curl
. L'esempio utilizza Google Cloud CLI per generare un token di accesso. Per istruzioni sull'installazione di gcloud CLI, consulta la quickstart.
L'esempio seguente mostra come richiedere la trascrizione di un file audio che può includere voce in inglese, francese o tedesco.
curl -s -H "Content-Type: application/json" \ -H "Authorization: Bearer $(gcloud auth application-default print-access-token)" \ https://speech.googleapis.com/v1p1beta1/speech:recognize \ --data '{ "config": { "encoding": "LINEAR16", "languageCode": "en-US", "alternativeLanguageCodes": ["fr-FR", "de-DE"], "model": "command_and_search" }, "audio": { "uri": "gs://cloud-samples-tests/speech/commercial_mono.wav" } }' > multi-language.txt
Se la richiesta ha esito positivo, il server restituisce un codice di stato HTTP 200 OK
e la risposta in formato JSON, salvate in un file denominato multi-language.txt
.
{ "results": [ { "alternatives": [ { "transcript": "hi I'd like to buy a Chromecast I'm ..." "confidence": 0.9466864 } ], "languageCode": "en-us" }, { "alternatives": [ { "transcript": " let's go with the black one", "confidence": 0.9829583 } ], "languageCode": "en-us" }, ] }
Java
Per scoprire come installare e utilizzare la libreria client per Speech-to-Text, consulta la pagina relativa alle librerie client di Speech-to-Text. Per maggiori informazioni, consulta la documentazione di riferimento dell'API Speech-to-Text Java.
Per eseguire l'autenticazione a Speech-to-Text, configura le Credenziali predefinite dell'applicazione. Per maggiori informazioni, consulta Configurare l'autenticazione per un ambiente di sviluppo locale.
Node.js
Per scoprire come installare e utilizzare la libreria client per Speech-to-Text, consulta la pagina relativa alle librerie client di Speech-to-Text. Per maggiori informazioni, consulta la documentazione di riferimento dell'API Speech-to-Text Node.js.
Per eseguire l'autenticazione a Speech-to-Text, configura le Credenziali predefinite dell'applicazione. Per maggiori informazioni, consulta Configurare l'autenticazione per un ambiente di sviluppo locale.
Python
Per scoprire come installare e utilizzare la libreria client per Speech-to-Text, consulta la pagina relativa alle librerie client di Speech-to-Text. Per maggiori informazioni, consulta la documentazione di riferimento dell'API Speech-to-Text Python.
Per eseguire l'autenticazione a Speech-to-Text, configura le Credenziali predefinite dell'applicazione. Per maggiori informazioni, consulta Configurare l'autenticazione per un ambiente di sviluppo locale.
Usa un file remoto
Java
Per scoprire come installare e utilizzare la libreria client per Speech-to-Text, consulta la pagina relativa alle librerie client di Speech-to-Text. Per maggiori informazioni, consulta la documentazione di riferimento dell'API Speech-to-Text Java.
Per eseguire l'autenticazione a Speech-to-Text, configura le Credenziali predefinite dell'applicazione. Per maggiori informazioni, consulta Configurare l'autenticazione per un ambiente di sviluppo locale.
Node.js
Per scoprire come installare e utilizzare la libreria client per Speech-to-Text, consulta la pagina relativa alle librerie client di Speech-to-Text. Per maggiori informazioni, consulta la documentazione di riferimento dell'API Speech-to-Text Node.js.
Per eseguire l'autenticazione a Speech-to-Text, configura le Credenziali predefinite dell'applicazione. Per maggiori informazioni, consulta Configurare l'autenticazione per un ambiente di sviluppo locale.
Python
Per scoprire come installare e utilizzare la libreria client per Speech-to-Text, consulta la pagina relativa alle librerie client di Speech-to-Text. Per maggiori informazioni, consulta la documentazione di riferimento dell'API Speech-to-Text Python.
Per eseguire l'autenticazione a Speech-to-Text, configura le Credenziali predefinite dell'applicazione. Per maggiori informazioni, consulta Configurare l'autenticazione per un ambiente di sviluppo locale.