Trascrivere il parlato in testo utilizzando gcloud CLI
Questa pagina mostra come inviare una richiesta di riconoscimento vocale a Speech-to-Text utilizzando lo strumento gcloud
dalla riga di comando.
Speech-to-Text consente di integrare facilmente le tecnologie di riconoscimento vocale di Google nelle applicazioni degli sviluppatori. Puoi inviare dati audio all'API Speech-to-Text, che restituisce una trascrizione del testo del file audio. Per ulteriori informazioni sul servizio, consulta Nozioni di base su Speech-to-Text.
Prima di iniziare
Prima di poter inviare una richiesta all'API Speech-to-Text, devi aver completato le azioni seguenti. Consulta le prima di iniziare per maggiori dettagli.
- Attivare Speech-to-Text in un progetto Google Cloud.
- Assicurati che la fatturazione sia abilitata per Speech-to-Text.
-
Install the Google Cloud CLI, then initialize it by running the following command:
gcloud init
- (Facoltativo) Crea un nuovo bucket Google Cloud Storage per archiviare i dati audio.
Esecuzione di una richiesta di trascrizione audio
Ora puoi usare Speech-to-Text per trascrivere un file audio
in testo. Utilizza il seguente esempio di codice per inviare un
Richiesta recognize
all'API Speech-to-Text.
Apri la shell della riga di comando ed esegui questo comando.
gcloud ml speech recognize gs://cloud-samples-tests/speech/brooklyn.flac \ --language-code=en-US
Questo comando richiede la trascrizione di Speech-to-Text l'audio contenuto in un file FLAC ospitato sul un luogo accessibile al pubblico.
Se la richiesta riesce, il server restituisce una risposta in Formato JSON:
{ "results": [ { "alternatives": [ { "confidence": 0.9840146, "transcript": "how old is the Brooklyn Bridge" } ] } ] }
Complimenti! Hai inviato la tua prima richiesta a Speech-to-Text.
Se ricevi un errore o una risposta vuota da Speech-to-Text, dai un'occhiata risoluzione dei problemi e i passaggi per la mitigazione degli errori.
Esegui la pulizia
Per evitare che al tuo account Google Cloud vengano addebitati costi relativi alle risorse utilizzate in questa pagina, segui questi passaggi.
- Utilizza la console Google Cloud per eliminare il progetto se non ti serve.
Passaggi successivi
- Fai pratica di trascrizione di file audio brevi.
- Scopri come eseguire il batch di file audio lunghi per il riconoscimento vocale.
- Scopri come trascrivere audio in streaming come da un microfono.
- Inizia a utilizzare Speech-to-Text nella lingua che preferisci utilizzando una libreria client Speech-to-Text.
- Esamina le applicazioni di esempio.
- Per prestazioni ottimali, precisione e altri suggerimenti, consulta la best practice.