Trascrivi voce in testo utilizzando la riga di comando
Questa pagina mostra come inviare una richiesta di riconoscimento vocale a Speech-to-Text utilizzando l'interfaccia REST e il comando curl
.
Speech-to-Text consente una facile integrazione delle tecnologie di riconoscimento vocale di Google nelle applicazioni per sviluppatori. Puoi inviare i dati audio all'API Speech-to-Text, che restituisce una trascrizione del testo di tale file audio. Per scoprire di più sul servizio, consulta le nozioni di base su Speech-to-Text.
Prima di iniziare
- Accedi al tuo account Google Cloud. Se non conosci Google Cloud, crea un account per valutare le prestazioni dei nostri prodotti in scenari reali. I nuovi clienti ricevono anche 300 $di crediti gratuiti per l'esecuzione, il test e il deployment dei carichi di lavoro.
-
Nella pagina del selettore dei progetti in Google Cloud Console, seleziona o crea un progetto Google Cloud.
-
Assicurati che la fatturazione sia attivata per il tuo progetto Cloud. Scopri come verificare se la fatturazione è abilitata su un progetto.
-
Abilita le API Speech-to-Text.
-
Assicurati di avere il ruolo o i ruoli seguenti per il progetto: Cloud Speech Administrator
Verifica i ruoli
-
Nella console Google Cloud, vai alla pagina IAM.
Vai a IAM - Seleziona il progetto.
-
Individua la riga contenente il tuo indirizzo email nella colonna Entità.
Se il tuo indirizzo email non è indicato nella colonna, significa che non hai ruoli.
- Nella colonna Role (Ruolo) della riga contenente l'indirizzo email, controlla se l'elenco di ruoli include i ruoli richiesti.
Concedi i ruoli
-
Nella console Google Cloud, vai alla pagina IAM.
Vai a IAM - Seleziona il progetto.
- Fai clic su Concedi l'accesso.
- Inserisci il tuo indirizzo email nel campo Nuove entità.
- Nell'elenco Seleziona un ruolo, seleziona un ruolo.
- Per concedere altri ruoli, fai clic su Aggiungi un altro ruolo e aggiungi ogni ruolo aggiuntivo.
- Fai clic su Salva.
-
- Installa Google Cloud CLI.
-
Per inizializzare l'interfaccia a riga di comando gcloud, esegui il comando seguente:
gcloud init
-
Nella pagina del selettore dei progetti in Google Cloud Console, seleziona o crea un progetto Google Cloud.
-
Assicurati che la fatturazione sia attivata per il tuo progetto Cloud. Scopri come verificare se la fatturazione è abilitata su un progetto.
-
Abilita le API Speech-to-Text.
-
Assicurati di avere il ruolo o i ruoli seguenti per il progetto: Cloud Speech Administrator
Verifica i ruoli
-
Nella console Google Cloud, vai alla pagina IAM.
Vai a IAM - Seleziona il progetto.
-
Individua la riga contenente il tuo indirizzo email nella colonna Entità.
Se il tuo indirizzo email non è indicato nella colonna, significa che non hai ruoli.
- Nella colonna Role (Ruolo) della riga contenente l'indirizzo email, controlla se l'elenco di ruoli include i ruoli richiesti.
Concedi i ruoli
-
Nella console Google Cloud, vai alla pagina IAM.
Vai a IAM - Seleziona il progetto.
- Fai clic su Concedi l'accesso.
- Inserisci il tuo indirizzo email nel campo Nuove entità.
- Nell'elenco Seleziona un ruolo, seleziona un ruolo.
- Per concedere altri ruoli, fai clic su Aggiungi un altro ruolo e aggiungi ogni ruolo aggiuntivo.
- Fai clic su Salva.
-
- Installa Google Cloud CLI.
-
Per inizializzare l'interfaccia a riga di comando gcloud, esegui il comando seguente:
gcloud init
Configura l'autenticazione
Le librerie client possono utilizzare le credenziali predefinite dell'applicazione per eseguire facilmente l'autenticazione con le API di Google e inviare richieste a tali API. Con Credenziali predefinite dell'applicazione, puoi testare la tua applicazione in locale ed eseguirne il deployment senza modificare il codice sottostante. Per ulteriori informazioni, tra cui esempi di codice, consulta la guida all'autenticazione in Google Cloud .
Crea le credenziali di autenticazione per il tuo Account Google:
gcloud auth application-default login
Crea un riconoscimento
Per inviare una richiesta di riconoscimento, devi prima creare un Riconoscimento. Utilizza il comando seguente per creare un riconoscimento.
Sostituisci PROJECT_ID
con l'ID del tuo progetto Google Cloud e RECOGNIZER_ID
con un identificatore del tuo riconoscimento.
curl -X POST \ -H "Authorization: Bearer $(gcloud auth application-default print-access-token)" \ -H "Content-Type: application/json; charset=utf-8" \ --data "{\"languageCodes\": \"en-US\", \"model\": \"latest_long\"}" \ https://speech.googleapis.com/v2/projects/PROJECT_ID/locations/global/recognizers?recognizer_id=RECOGNIZER_ID
Esecuzione di una richiesta di trascrizione di audio
Ora puoi utilizzare Speech-to-Text per trascrivere un file audio in testo. Utilizza il seguente esempio di codice per inviare una richiesta REST di recognize
all'API Speech-to-Text.
-
Crea un file di richiesta JSON con il testo seguente e salvalo come file di testo normale
sync-request.json
. Sostituisci/full/path/to/audio/file.wav
con il percorso del file audio che vuoi trascrivere:{ \"config\": { \"auto_decoding_config": {} }, \"content\": \"$(base64 -w 0 /full/path/to/audio/file.wav | sed 's/+/-/g; s/\//_/g')\" }
-
Utilizza
curl
per effettuare una richiestaspeech:recognize
, passando il nome file della richiesta JSON che hai configurato nel passaggio 1:curl -s -H "Content-Type: application/json" \ -H "Authorization: Bearer "$(gcloud auth application-default print-access-token) \ https://speech.googleapis.com/v2/projects/PROJECT_ID/locations/global/recognizers/RECOGNIZER_ID:recognize \ -d @sync-request.json
Tieni presente che per passare un nome file a
curl
, utilizzi l'opzione-d
(per "dati") e anteponi il segno@
al nome file. Questo file deve trovarsi nella stessa directory in cui esegui il comandocurl
.Dovresti vedere una risposta simile alla seguente:
{ "results": [ { "alternatives": [ { "transcript": "how old is the Brooklyn Bridge", "confidence": 0.98267895 } ] } ] }
Complimenti! Hai inviato la tua prima richiesta a Speech-to-Text.
Se ricevi un errore o una risposta vuota da Speech-to-Text, dai un'occhiata ai passaggi di risoluzione dei problemi e di attenuazione degli errori.
Esegui la pulizia
Per evitare che al tuo account Google Cloud vengano addebitati costi relativi alle risorse utilizzate in questa pagina, segui questi passaggi:
-
(Facoltativo) Revoca le credenziali di autenticazione che hai creato ed elimina il file delle credenziali locale.
gcloud auth application-default revoke
-
Facoltativo: revoca le credenziali dall'interfaccia a riga di comando gcloud.
gcloud auth revoke
Console
gcloud CLI
Elimina un progetto Cloud:
gcloud projects delete PROJECT_ID
Passaggi successivi
- Esercitati a trascrivere file audio brevi.
- Scopri come trascrivere audio in streaming, ad esempio da un microfono.
- Inizia a utilizzare Speech-to-Text nella lingua che preferisci utilizzando una libreria client di Speech-to-Text.
- Per prestazioni ottimali e altri suggerimenti, consulta la documentazione sulle best practice.