Trascrizione della voce in testo con gcloud CLI
Questa pagina mostra come inviare una richiesta di riconoscimento vocale a Speech-to-Text utilizzando lo strumento gcloud
dalla riga di comando.
Speech-to-Text consente l'integrazione semplice delle tecnologie di riconoscimento vocale di Google nelle applicazioni degli sviluppatori. Puoi inviare dati audio all'API Speech-to-Text, che restituisce una trascrizione del testo del file audio. Per maggiori informazioni sul servizio, consulta Nozioni di base su Speech-to-Text.
Prima di iniziare
Prima di poter inviare una richiesta all'API Speech-to-Text, devi aver completato le seguenti azioni. Per informazioni dettagliate, consulta la pagina Prima di iniziare.
- Abilitare Speech-to-Text in un progetto Google Cloud.
- Assicurati che la fatturazione sia abilitata per Speech-to-Text.
-
Installa Google Cloud CLI, quindi initialize eseguendo questo comando:
gcloud init
- (Facoltativo) Crea un nuovo bucket Google Cloud Storage per archiviare i dati audio.
Esecuzione di una richiesta di trascrizione audio
Ora puoi usare Speech-to-Text per trascrivere un file audio
in testo. Utilizza il seguente esempio di codice per inviare una richiesta recognize
all'API Speech-to-Text.
Apri la shell della riga di comando ed esegui questo comando.
gcloud ml speech recognize gs://cloud-samples-tests/speech/brooklyn.flac \ --language-code=en-US
Questo comando richiede che Speech-to-Text trascriva l'audio contenuto in un file FLAC ospitato in una posizione accessibile pubblicamente.
Se la richiesta ha esito positivo, il server restituisce una risposta in formato JSON:
{ "results": [ { "alternatives": [ { "confidence": 0.9840146, "transcript": "how old is the Brooklyn Bridge" } ] } ] }
Complimenti! Hai inviato la tua prima richiesta a Speech-to-Text.
Se ricevi un errore o una risposta vuota da Speech-to-Text, dai un'occhiata ai passaggi per la risoluzione dei problemi e la mitigazione degli errori.
Esegui la pulizia
Per evitare che al tuo account Google Cloud vengano addebitati costi relativi alle risorse utilizzate in questa pagina, segui questi passaggi:
- Utilizza la console Google Cloud per eliminare il progetto se non ti serve.
Passaggi successivi
- Esercitati a trascrivere file audio brevi.
- Scopri come eseguire il batch di file audio lunghi per il riconoscimento vocale.
- Scopri come trascrivere audio in streaming, ad esempio da un microfono.
- Inizia a utilizzare Speech-to-Text nella lingua che preferisci utilizzando una libreria client di Speech-to-Text.
- Esamina le applicazioni di esempio.
- Per prestazioni ottimali, precisione e altri suggerimenti, consulta la documentazione sulle best practice.