Questa pagina descrive come attivare il riconoscimento della lingua per le richieste di trascrizione audio inviate a Speech-to-Text.
In alcuni casi, non sai con certezza quale lingua contengono le tue registrazioni audio. Ad esempio, se pubblichi il tuo servizio, la tua app o il tuo prodotto in un paese con più lingue ufficiali, puoi potenzialmente ricevere input audio da utenti in diverse lingue. In questo modo, è possibile specificare un singolo codice lingua le richieste di trascrizione in modo molto più difficile.
Riconoscimento di più lingue
Speech-to-Text ti offre un modo per specificare un insieme di lingue alternative che i tuoi dati audio potrebbero contenere. Quando invii una richiesta di trascrizione audio a Speech-to-Text, puoi fornire un elenco di lingue aggiuntive che i dati audio potrebbero includere. Se includi un elenco di lingue nella tua richiesta, Speech-to-Text tenta di trascrivere l'audio in base al il linguaggio più adatto al campione delle alternative che hai fornito. Speech-to-Text etichetta quindi i risultati della trascrizione con il codice lingua previsto.
Questa funzionalità è ideale per le app che devono trascrivere brevi frasi come comandi vocali o ricerche. Puoi elencare fino a tre lingue alternative da tra quelli supportati da Speech-to-Text oltre alla tua lingua principale (per un totale di quattro lingue).
Anche se puoi specificare lingue alternative per la tua richiesta di trascrizione vocale, devi comunque fornire un codice lingua principale nel campo languageCode
. Inoltre, devi limitare al minimo il numero di lingue richieste. Meno codici di lingua alternativi richiedi, più facilmente Speech-to-Text riesce a selezionare quello corretto. Specificare una sola lingua
produce i risultati migliori.
Attiva il riconoscimento della lingua nelle richieste di trascrizione audio
Per specificare lingue alternative nella trascrizione audio:
devi impostare il campo alternativeLanguageCodes
su un elenco di
i codici lingua in RecognitionConfig
parametri per la richiesta. Speech-to-Text supporta
codici lingua alternativi per tutti i metodi di riconoscimento vocale:
speech:recognize
,
speech:longrunningrecognize
,
e Streaming.
Utilizza un file locale
Protocollo
Per informazioni dettagliate, consulta l'endpoint dell'API speech:recognize
.
Per eseguire il riconoscimento vocale sincrono, effettua una richiesta POST
e fornisci il corpo della richiesta appropriato. Di seguito è riportato un esempio di richiesta POST
mediante curl
. L'esempio utilizza Google Cloud CLI per generare un accesso
di accesso. Per istruzioni sull'installazione di gcloud CLI,
consulta la guida rapida.
L'esempio seguente mostra come richiedere la trascrizione di un file audio che può includere discorsi in inglese, francese o tedesco.
curl -s -H "Content-Type: application/json" \ -H "Authorization: Bearer $(gcloud auth application-default print-access-token)" \ https://speech.googleapis.com/v1p1beta1/speech:recognize \ --data '{ "config": { "encoding": "LINEAR16", "languageCode": "en-US", "alternativeLanguageCodes": ["fr-FR", "de-DE"], "model": "command_and_search" }, "audio": { "uri": "gs://cloud-samples-tests/speech/commercial_mono.wav" } }' > multi-language.txt
Se la richiesta riesce, il server restituisce un HTTP 200 OK
codice di stato e la risposta in formato JSON, salvati in un file
denominato multi-language.txt
.
{ "results": [ { "alternatives": [ { "transcript": "hi I'd like to buy a Chromecast I'm ..." "confidence": 0.9466864 } ], "languageCode": "en-us" }, { "alternatives": [ { "transcript": " let's go with the black one", "confidence": 0.9829583 } ], "languageCode": "en-us" }, ] }
Java
Per scoprire come installare e utilizzare la libreria client per Speech-to-Text, consulta Librerie client di Speech-to-Text. Per ulteriori informazioni, consulta la documentazione di riferimento dell'API Speech-to-Text Java.
Per eseguire l'autenticazione a Speech-to-Text, configura le credenziali predefinite dell'applicazione. Per ulteriori informazioni, vedi Configura l'autenticazione per un ambiente di sviluppo locale.
Node.js
Per scoprire come installare e utilizzare la libreria client per Speech-to-Text, consulta Librerie client di Speech-to-Text. Per ulteriori informazioni, consulta la documentazione di riferimento dell'API Speech-to-Text Node.js.
Per autenticarti a Speech-to-Text, configura le credenziali predefinite dell'applicazione. Per ulteriori informazioni, vedi Configura l'autenticazione per un ambiente di sviluppo locale.
Python
Per scoprire come installare e utilizzare la libreria client per Speech-to-Text, vedi Librerie client di Speech-to-Text. Per ulteriori informazioni, consulta la documentazione di riferimento dell'API Speech-to-Text Python.
Per autenticarti a Speech-to-Text, configura le credenziali predefinite dell'applicazione. Per maggiori informazioni, consulta Configurare l'autenticazione per un ambiente di sviluppo locale.
Utilizzare un file remoto
Java
Per scoprire come installare e utilizzare la libreria client per Speech-to-Text, consulta Librerie client di Speech-to-Text. Per ulteriori informazioni, consulta API Java Speech-to-Text documentazione di riferimento.
Per autenticarti a Speech-to-Text, configura le credenziali predefinite dell'applicazione. Per maggiori informazioni, consulta Configurare l'autenticazione per un ambiente di sviluppo locale.
Node.js
Per scoprire come installare e utilizzare la libreria client per Speech-to-Text, vedi Librerie client di Speech-to-Text. Per ulteriori informazioni, consulta la documentazione di riferimento dell'API Speech-to-Text Node.js.
Per autenticarti a Speech-to-Text, configura le credenziali predefinite dell'applicazione. Per maggiori informazioni, consulta Configurare l'autenticazione per un ambiente di sviluppo locale.
Python
Per scoprire come installare e utilizzare la libreria client per Speech-to-Text, consulta Librerie client di Speech-to-Text. Per ulteriori informazioni, consulta la documentazione di riferimento dell'API Speech-to-Text Python.
Per autenticarti a Speech-to-Text, configura le credenziali predefinite dell'applicazione. Per ulteriori informazioni, vedi Configura l'autenticazione per un ambiente di sviluppo locale.