Questa sezione spiega come trascrivere audio in streaming, come da un microfono, in testo.
Il riconoscimento vocale in streaming ti consente di trasmettere audio in streaming a Speech-to-Text e ricevere i risultati del riconoscimento vocale in streaming in tempo reale mentre l'audio viene elaborato. Consulta anche i limiti relativi all'audio per le richieste di riconoscimento vocale in streaming. Il riconoscimento vocale di audio in streaming è disponibile solo tramite gRPC.
Esecuzione del riconoscimento vocale in streaming su un file locale
Di seguito è riportato un esempio di esecuzione del riconoscimento vocale in streaming su un
file audio locale. Esiste un limite di 10 MB per tutte le richieste di streaming inviate all'API. Questo
il limite si applica a entrambe le richieste iniziali StreamingRecognize
e la dimensione di ogni singolo messaggio nel flusso. Il superamento di questo limite causerà un errore.
Go
Per scoprire come installare e utilizzare la libreria client per Speech-to-Text, consulta Librerie client di Speech-to-Text. Per ulteriori informazioni, consulta API Go Speech-to-Text documentazione di riferimento.
Per eseguire l'autenticazione a Speech-to-Text, configura le credenziali predefinite dell'applicazione. Per ulteriori informazioni, vedi Configura l'autenticazione per un ambiente di sviluppo locale.
Java
Per scoprire come installare e utilizzare la libreria client per Speech-to-Text, vedi Librerie client di Speech-to-Text. Per ulteriori informazioni, consulta la documentazione di riferimento dell'API Speech-to-Text Java.
Per autenticarti a Speech-to-Text, configura le credenziali predefinite dell'applicazione. Per ulteriori informazioni, vedi Configura l'autenticazione per un ambiente di sviluppo locale.
Node.js
Per scoprire come installare e utilizzare la libreria client per Speech-to-Text, vedi Librerie client di Speech-to-Text. Per ulteriori informazioni, consulta la documentazione di riferimento dell'API Speech-to-Text Node.js.
Per autenticarti a Speech-to-Text, configura le credenziali predefinite dell'applicazione. Per maggiori informazioni, consulta Configurare l'autenticazione per un ambiente di sviluppo locale.
Python
Per scoprire come installare e utilizzare la libreria client per Speech-to-Text, consulta Librerie client di Speech-to-Text. Per ulteriori informazioni, consulta la documentazione di riferimento dell'API Speech-to-Text Python.
Per eseguire l'autenticazione a Speech-to-Text, configura le credenziali predefinite dell'applicazione. Per maggiori informazioni, consulta Configurare l'autenticazione per un ambiente di sviluppo locale.
Linguaggi aggiuntivi
C#: Segui le Istruzioni per la configurazione di C# Nella pagina delle librerie client e poi visita Documentazione di riferimento di Speech-to-Text per .NET.
PHP: segui le istruzioni di configurazione di PHP nella pagina delle librerie client e poi consulta la documentazione di riferimento di Speech-to-Text per PHP.
Ruby: Segui le Istruzioni per la configurazione di Ruby Nella pagina delle librerie client e poi visita Documentazione di riferimento di Speech-to-Text per Ruby.
Sebbene tu possa riprodurre in streaming un file audio locale nell'API Speech-to-Text, è consigliabile eseguire il riconoscimento audio sincrono o asincrono per i risultati in modalità batch.
Eseguire il riconoscimento vocale di audio in streaming su uno stream audio
Speech-to-Text può anche eseguire il riconoscimento su audio in streaming e in tempo reale.
Ecco un esempio di esecuzione del riconoscimento vocale di audio in streaming su uno stream audio ricevuto da un microfono:
Go
Per scoprire come installare e utilizzare la libreria client per Speech-to-Text, vedi Librerie client di Speech-to-Text. Per ulteriori informazioni, consulta la documentazione di riferimento dell'API Speech-to-Text Go.
Per autenticarti a Speech-to-Text, configura le credenziali predefinite dell'applicazione. Per maggiori informazioni, consulta Configurare l'autenticazione per un ambiente di sviluppo locale.
Python
Per scoprire come installare e utilizzare la libreria client per Speech-to-Text, vedi Librerie client di Speech-to-Text. Per ulteriori informazioni, consulta API Python Speech-to-Text documentazione di riferimento.
Per autenticarti a Speech-to-Text, configura le credenziali predefinite dell'applicazione. Per ulteriori informazioni, vedi Configura l'autenticazione per un ambiente di sviluppo locale.
Java
Per scoprire come installare e utilizzare la libreria client per Speech-to-Text, vedi Librerie client di Speech-to-Text. Per ulteriori informazioni, consulta API Java Speech-to-Text documentazione di riferimento.
Per autenticarti a Speech-to-Text, configura le credenziali predefinite dell'applicazione. Per maggiori informazioni, consulta Configurare l'autenticazione per un ambiente di sviluppo locale.
Node.js
Questi esempi richiedono l'installazione di SoX, che deve essere disponibile nel tuo $PATH
.
- Per Mac OS:
brew install sox
. - Per la maggior parte delle distribuzioni Linux:
sudo apt-get install sox libsox-fmt-all
. - Per Windows: scarica i file binari.
Per saperne di più sull'installazione e sulla creazione di un client Speech-to-Text, consulta Librerie client di Speech-to-Text.
Linguaggi aggiuntivi
C#: Segui le Istruzioni per la configurazione di C# Nella pagina delle librerie client e poi visita Documentazione di riferimento di Speech-to-Text per .NET.
PHP: segui le istruzioni di configurazione di PHP nella pagina delle librerie client e poi consulta la documentazione di riferimento di Speech-to-Text per PHP.
Ruby: segui le istruzioni di configurazione di Ruby nella pagina delle librerie client e poi consulta la documentazione di riferimento di Speech-to-Text per Ruby.
Esecuzione del riconoscimento vocale in streaming senza fine
Ecco un esempio di esecuzione del riconoscimento vocale di audio in streaming su uno stream audio infinito ricevuto da un microfono:
Python
Per scoprire come installare e utilizzare la libreria client per Speech-to-Text, consulta Librerie client di Speech-to-Text. Per ulteriori informazioni, consulta la documentazione di riferimento dell'API Speech-to-Text Python.
Per eseguire l'autenticazione a Speech-to-Text, configura le credenziali predefinite dell'applicazione. Per ulteriori informazioni, vedi Configura l'autenticazione per un ambiente di sviluppo locale.
Java
Per scoprire come installare e utilizzare la libreria client per Speech-to-Text, vedi Librerie client di Speech-to-Text. Per ulteriori informazioni, consulta la documentazione di riferimento dell'API Speech-to-Text Java.
Per autenticarti a Speech-to-Text, configura le credenziali predefinite dell'applicazione. Per ulteriori informazioni, vedi Configura l'autenticazione per un ambiente di sviluppo locale.
Node.js
Questo esempio richiede l'installazione di SoX, che deve essere disponibile in $PATH
.
- Per Mac OS:
brew install sox
. - Per la maggior parte delle distribuzioni Linux:
sudo apt-get install sox libsox-fmt-all
. - Per Windows: scarica i file binari.
Per saperne di più sull'installazione e sulla creazione di un client Speech-to-Text, consulta Librerie client Speech-to-Text.
Passaggi successivi
- Scopri come misurare e migliorare l'accuratezza
Provalo
Se non conosci Google Cloud, crea un account per valutare le prestazioni di Speech-to-Text in scenari reali. I nuovi clienti ricevono anche 300 $ di crediti gratuiti per l'esecuzione, il test e il deployment dei carichi di lavoro.
Prova Speech-to-Text gratuitamente