Mantieni tutto organizzato con le raccolte Salva e classifica i contenuti in base alle tue preferenze.

Trascrivi voce in testo utilizzando la riga di comando

Questa pagina mostra come inviare una richiesta di riconoscimento vocale a Speech-to-Text utilizzando l'interfaccia REST e il comando curl.

Speech-to-Text consente una facile integrazione delle tecnologie di riconoscimento vocale di Google nelle applicazioni per sviluppatori. Puoi inviare i dati audio all'API Speech-to-Text, che restituisce una trascrizione del testo di tale file audio. Per scoprire di più sul servizio, consulta le nozioni di base su Speech-to-Text.

Prima di iniziare

  1. Accedi al tuo account Google Cloud. Se non conosci Google Cloud, crea un account per valutare le prestazioni dei nostri prodotti in scenari reali. I nuovi clienti ricevono anche 300 $di crediti gratuiti per l'esecuzione, il test e il deployment dei carichi di lavoro.
  2. Nella pagina del selettore dei progetti in Google Cloud Console, seleziona o crea un progetto Google Cloud.

    Vai al selettore progetti

  3. Assicurati che la fatturazione sia attivata per il tuo progetto Cloud. Scopri come verificare se la fatturazione è abilitata su un progetto.

  4. Abilita le API Speech-to-Text.

    Abilita le API

  5. Assicurati di avere il ruolo o i ruoli seguenti per il progetto: Cloud Speech Administrator

    Verifica i ruoli

    1. Nella console Google Cloud, vai alla pagina IAM.

      Vai a IAM
    2. Seleziona il progetto.
    3. Individua la riga contenente il tuo indirizzo email nella colonna Entità.

      Se il tuo indirizzo email non è indicato nella colonna, significa che non hai ruoli.

    4. Nella colonna Role (Ruolo) della riga contenente l'indirizzo email, controlla se l'elenco di ruoli include i ruoli richiesti.

    Concedi i ruoli

    1. Nella console Google Cloud, vai alla pagina IAM.

      Vai a IAM
    2. Seleziona il progetto.
    3. Fai clic su Concedi l'accesso.
    4. Inserisci il tuo indirizzo email nel campo Nuove entità.
    5. Nell'elenco Seleziona un ruolo, seleziona un ruolo.
    6. Per concedere altri ruoli, fai clic su Aggiungi un altro ruolo e aggiungi ogni ruolo aggiuntivo.
    7. Fai clic su Salva.
  6. Installa Google Cloud CLI.
  7. Per inizializzare l'interfaccia a riga di comando gcloud, esegui il comando seguente:

    gcloud init
  8. Nella pagina del selettore dei progetti in Google Cloud Console, seleziona o crea un progetto Google Cloud.

    Vai al selettore progetti

  9. Assicurati che la fatturazione sia attivata per il tuo progetto Cloud. Scopri come verificare se la fatturazione è abilitata su un progetto.

  10. Abilita le API Speech-to-Text.

    Abilita le API

  11. Assicurati di avere il ruolo o i ruoli seguenti per il progetto: Cloud Speech Administrator

    Verifica i ruoli

    1. Nella console Google Cloud, vai alla pagina IAM.

      Vai a IAM
    2. Seleziona il progetto.
    3. Individua la riga contenente il tuo indirizzo email nella colonna Entità.

      Se il tuo indirizzo email non è indicato nella colonna, significa che non hai ruoli.

    4. Nella colonna Role (Ruolo) della riga contenente l'indirizzo email, controlla se l'elenco di ruoli include i ruoli richiesti.

    Concedi i ruoli

    1. Nella console Google Cloud, vai alla pagina IAM.

      Vai a IAM
    2. Seleziona il progetto.
    3. Fai clic su Concedi l'accesso.
    4. Inserisci il tuo indirizzo email nel campo Nuove entità.
    5. Nell'elenco Seleziona un ruolo, seleziona un ruolo.
    6. Per concedere altri ruoli, fai clic su Aggiungi un altro ruolo e aggiungi ogni ruolo aggiuntivo.
    7. Fai clic su Salva.
  12. Installa Google Cloud CLI.
  13. Per inizializzare l'interfaccia a riga di comando gcloud, esegui il comando seguente:

    gcloud init

Configura l'autenticazione

Le librerie client possono utilizzare le credenziali predefinite dell'applicazione per eseguire facilmente l'autenticazione con le API di Google e inviare richieste a tali API. Con Credenziali predefinite dell'applicazione, puoi testare la tua applicazione in locale ed eseguirne il deployment senza modificare il codice sottostante. Per ulteriori informazioni, tra cui esempi di codice, consulta la guida all'autenticazione in Google Cloud .

Crea le credenziali di autenticazione per il tuo Account Google:

gcloud auth application-default login

Crea un riconoscimento

Per inviare una richiesta di riconoscimento, devi prima creare un Riconoscimento. Utilizza il comando seguente per creare un riconoscimento.

Sostituisci PROJECT_ID con l'ID del tuo progetto Google Cloud e RECOGNIZER_ID con un identificatore del tuo riconoscimento.

curl -X POST \
    -H "Authorization: Bearer $(gcloud auth application-default print-access-token)" \
    -H "Content-Type: application/json; charset=utf-8" \
    --data "{\"languageCodes\": \"en-US\", \"model\": \"latest_long\"}" \
    https://speech.googleapis.com/v2/projects/PROJECT_ID/locations/global/recognizers?recognizer_id=RECOGNIZER_ID

Esecuzione di una richiesta di trascrizione di audio

Ora puoi utilizzare Speech-to-Text per trascrivere un file audio in testo. Utilizza il seguente esempio di codice per inviare una richiesta REST di recognize all'API Speech-to-Text.

  1. Crea un file di richiesta JSON con il testo seguente e salvalo come file di testo normale sync-request.json. Sostituisci /full/path/to/audio/file.wav con il percorso del file audio che vuoi trascrivere:

    {
      \"config\": {
        \"auto_decoding_config": {}
      },
      \"content\": \"$(base64 -w 0 /full/path/to/audio/file.wav | sed 's/+/-/g; s/\//_/g')\"
    }
      
  2. Utilizza curl per effettuare una richiesta speech:recognize, passando il nome file della richiesta JSON che hai configurato nel passaggio 1:

    curl -s -H "Content-Type: application/json" \
        -H "Authorization: Bearer "$(gcloud auth application-default print-access-token) \
        https://speech.googleapis.com/v2/projects/PROJECT_ID/locations/global/recognizers/RECOGNIZER_ID:recognize \
        -d @sync-request.json
      

    Tieni presente che per passare un nome file a curl, utilizzi l'opzione -d (per "dati") e anteponi il segno @ al nome file. Questo file deve trovarsi nella stessa directory in cui esegui il comando curl.

    Dovresti vedere una risposta simile alla seguente:

    {
      "results": [
        {
          "alternatives": [
            {
              "transcript": "how old is the Brooklyn Bridge",
              "confidence": 0.98267895
            }
          ]
        }
      ]
    }
      

Complimenti! Hai inviato la tua prima richiesta a Speech-to-Text.

Se ricevi un errore o una risposta vuota da Speech-to-Text, dai un'occhiata ai passaggi di risoluzione dei problemi e di attenuazione degli errori.

Esegui la pulizia

Per evitare che al tuo account Google Cloud vengano addebitati costi relativi alle risorse utilizzate in questa pagina, segui questi passaggi:

  1. (Facoltativo) Revoca le credenziali di autenticazione che hai creato ed elimina il file delle credenziali locale.

    gcloud auth application-default revoke
  2. Facoltativo: revoca le credenziali dall'interfaccia a riga di comando gcloud.

    gcloud auth revoke

Console

  • In Google Cloud Console, vai alla pagina Gestisci risorse.

    Vai a Gestisci risorse

  • Nell'elenco dei progetti, seleziona il progetto che vuoi eliminare, quindi fai clic su Elimina.
  • Nella finestra di dialogo, digita l'ID del progetto e fai clic su Chiudi per eliminare il progetto.
  • gcloud CLI

    Elimina un progetto Cloud:

    gcloud projects delete PROJECT_ID

    Passaggi successivi