Trascrivere il parlato in testo utilizzando le librerie client
In questa pagina viene mostrato come inviare una richiesta di riconoscimento vocale a Speech-to-Text nel tuo linguaggio di programmazione preferito utilizzando il Librerie client di Google Cloud.
Speech-to-Text consente una facile integrazione della sintesi vocale di Google di riconoscimento delle tecnologie nelle applicazioni degli sviluppatori. Puoi inviare dati audio all'API Speech-to-Text, che restituisce una trascrizione del testo del file audio. Per ulteriori informazioni vedi il servizio Nozioni di base su Speech-to-Text.
Prima di iniziare
Prima di poter inviare una richiesta all'API Speech-to-Text, devi aver completato le seguenti azioni. Consulta le prima di iniziare per maggiori dettagli.
- Abilita Speech-to-Text in un progetto Google Cloud.
- Assicurati che la fatturazione sia abilitata per Speech-to-Text.
-
Install the Google Cloud CLI, then initialize it by running the following command:
gcloud init
-
If you're using a local shell, then create local authentication credentials for your user account:
gcloud auth application-default login
You don't need to do this if you're using Cloud Shell.
- (Facoltativo) Crea un nuovo bucket Google Cloud Storage in cui archiviare l'audio e i dati di Google Cloud.
installa la libreria client
Go
go get cloud.google.com/go/speech/apiv1
Java
If you are using Maven, add
the following to your pom.xml
file. For more information about
BOMs, see The Google Cloud Platform Libraries BOM.
If you are using Gradle, add the following to your dependencies:
If you are using sbt, add the following to your dependencies:
If you're using Visual Studio Code, IntelliJ, or Eclipse, you can add client libraries to your project using the following IDE plugins:
The plugins provide additional functionality, such as key management for service accounts. Refer to each plugin's documentation for details.
Node.js
Prima di installare la libreria, assicurati di aver preparato l'ambiente per lo sviluppo Node.js.
npm install --save @google-cloud/speech
Python
Prima di installare la libreria, assicurati di aver preparato l'ambiente per lo sviluppo Python.
pip install --upgrade google-cloud-speech
Esecuzione di una richiesta di trascrizione audio
Ora puoi utilizzare Speech-to-Text per trascrivere un file audio in testo. Utilizza il seguente codice per inviare una richiesta recognize
all'API Speech-to-Text.
Go
Java
Node.js
Prima di eseguire l'esempio, assicurati di aver preparato l'ambiente per lo sviluppo Node.js.
Python
Prima di eseguire l'esempio, assicurati di aver preparato il tuo ambiente per lo sviluppo in Python.
Complimenti! Hai inviato la tua prima richiesta a Speech-to-Text.
Se ricevi un errore o una risposta vuota da Speech-to-Text, dai un'occhiata risoluzione dei problemi e i passaggi per la mitigazione degli errori.
Esegui la pulizia
Per evitare che al tuo account Google Cloud vengano addebitati costi relativi alle risorse utilizzate in questa pagina, segui questi passaggi.
- Utilizza la console Google Cloud per eliminare il progetto se non ti serve.
Passaggi successivi
- Esercitati a trascrivere file audio brevi.
- Scopri come raggruppare file audio lunghi per il riconoscimento vocale.
- Scopri come trascrivere audio in streaming come da un microfono.
- Inizia a utilizzare Speech-to-Text nella lingua che preferisci utilizzando una libreria client di Speech-to-Text.
- Scopri le applicazioni di esempio.
- Per ottenere il massimo rendimento e la massima precisione e altri suggerimenti, consulta la documentazione sulle best practice.