Trascrivi voce in testo utilizzando le librerie client
Questa pagina mostra come inviare una richiesta di riconoscimento vocale a Speech-to-Text nel tuo linguaggio di programmazione preferito utilizzando le librerie client di Google Cloud.
Speech-to-Text consente l'integrazione semplice delle tecnologie di riconoscimento vocale di Google nelle applicazioni per sviluppatori. Puoi inviare i dati audio all'API Speech-to-Text, che a sua volta restituisce una trascrizione del testo di quel file audio. Per ulteriori informazioni sul servizio, consulta le nozioni di base su Speech-to-Text.
Prima di iniziare
Prima di poter inviare una richiesta all'API Speech-to-Text, devi aver completato le seguenti azioni. Consulta la pagina prima di iniziare per i dettagli.
- Abilitare Speech-to-Text su un progetto Google Cloud.
- Assicurati che la fatturazione sia abilitata per Speech-to-Text.
- Crea e/o assegna uno o più account di servizio a Speech-to-Text.
- Scarica una chiave delle credenziali dell'account di servizio.
- Imposta la variabile di ambiente di autenticazione.
- (Facoltativo) Crea un nuovo bucket Google Cloud Storage per archiviare i tuoi dati audio.
Installa la libreria client
Go
go get cloud.google.com/go/speech/apiv1
Java
Se utilizzi Maven, aggiungi quanto segue al file pom.xml
. Per ulteriori informazioni sui
BOM, consulta la pagina BOM delle librerie Google Cloud Platform.
Se utilizzi Gradle, aggiungi quanto segue alle dipendenze:
Se utilizzi sbt, aggiungi quanto segue alle dipendenze:
Se utilizzi Visual Studio Code, IntelliJ o Eclipse, puoi aggiungere librerie client al progetto utilizzando i seguenti plug-in IDE:
I plug-in offrono funzionalità aggiuntive, come la gestione delle chiavi per gli account di servizio. Per informazioni dettagliate, consulta la documentazione di ogni plug-in.
Node.js
Prima di installare la libreria, assicurati di aver preparato il tuo ambiente per lo sviluppo di Node.js.
npm install --save @google-cloud/speech
Python
Prima di installare la libreria, assicurati di aver preparato il tuo ambiente per lo sviluppo Python.
pip install --upgrade google-cloud-speech
Esecuzione di una richiesta di trascrizione audio
Ora puoi utilizzare Speech-to-Text per trascrivere un file audio in testo. Utilizza il codice seguente per inviare una richiesta recognize
all'API Speech-to-Text.
Go
Java
Node.js
Prima di eseguire l'esempio, assicurati di aver preparato l'ambiente per lo sviluppo di Node.js.
Python
Prima di eseguire l'esempio, assicurati di aver preparato l'ambiente per lo sviluppo Python.
Complimenti! Hai inviato la tua prima richiesta a Speech-to-Text.
Se ricevi un errore o una risposta vuota da Speech-to-Text, dai un'occhiata ai passaggi per la risoluzione dei problemi e la attenuazione degli errori.
Esegui la pulizia
Per evitare che al tuo account Google Cloud vengano addebitati costi relativi alle risorse utilizzate in questa pagina, segui questi passaggi:
- Usa la console Google Cloud per eliminare il tuo progetto se non ti serve.
Passaggi successivi
- Esercitati a trascrivere file audio brevi.
- Scopri come raggruppare file audio lunghi per il riconoscimento vocale.
- Scopri come trascrivere audio in streaming come da un microfono.
- Inizia a utilizzare Speech-to-Text nella lingua di tua scelta utilizzando una libreria client di Speech-to-Text.
- Esamina le applicazioni di esempio.
- Per prestazioni ottimali, accuratezza e altri suggerimenti, consulta la documentazione delle best practice.