Prima di iniziare

Mantieni tutto organizzato con le raccolte Salva e classifica i contenuti in base alle tue preferenze.

Speech-to-Text è un'API basata sulla tecnologia di intelligenza artificiale (AI) di Google. Invia i dati audio a Speech-to-Text, quindi ricevi una trascrizione del testo dei tuoi dati audio in risposta. Per ulteriori informazioni sul funzionamento di Speech-to-Text, consulta la pagina di base.

Esistono due modi per accedere al servizio: utilizzando l'API REST o utilizzando la console di Speech-to-Text. Forniamo esempi di codice che mostrano come inviare una richiesta all'API REST e ricevere una risposta. Per informazioni su come utilizzare questi esempi, consulta le guide rapide e le guide illustrative di Speech-to-Text. Se preferisci utilizzare Speech-to-Text con una programmazione minima, puoi utilizzare Cloud Speech-to-Text Console.

Questa guida illustra i passaggi necessari per iniziare a inviare richieste all'API REST. Per iniziare a utilizzare la console di Speech-to-Text, consulta la guida rapida di UI Console.

Panoramica

Prima di poter iniziare a inviare richieste a Speech-to-Text, devi abilitare l'API in Google Cloud Console. I passaggi in questa pagina illustrano le seguenti azioni:

  • Abilitare Speech-to-Text su un progetto.
    1. Assicurati che la fatturazione sia abilitata per Speech-to-Text.
    2. Assicurati che il progetto abbia almeno un account di servizio.
    3. Scaricare una chiave delle credenziali dell'account di servizio.
  • Imposta la variabile di ambiente di autenticazione.
  • (Facoltativo) Crea un nuovo bucket Google Cloud Storage per archiviare i tuoi dati audio.

Configurare il progetto Google Cloud

  1. Accedi a Google Cloud Console

  2. Vai alla pagina del selettore di progetti

    Puoi scegliere un progetto esistente o crearne uno nuovo. Per ulteriori informazioni sulla creazione di un progetto, consulta la sezione Creazione e gestione dei progetti.

  3. Se crei un nuovo progetto, ti verrà chiesto di collegare un account di fatturazione al progetto. Se utilizzi un progetto preesistente, assicurati di avere abilitato la fatturazione.

    Scopri come verificare che la fatturazione sia attivata per il tuo progetto

  4. Dopo aver selezionato un progetto e averlo collegato a un account di fatturazione, puoi abilitare l'API Speech-to-Text. Vai alla barra Cerca prodotti e risorse nella parte superiore della pagina e digita "speech". Seleziona l'API Cloud Speech-to-Text dall'elenco dei risultati.

  5. Per provare Speech-to-Text senza collegarlo al tuo progetto, scegli l'opzione PROVA QUESTA API. Per abilitare l'API Speech-to-Text da utilizzare con il tuo progetto, fai clic su ABILITA.

  6. (Facoltativo) Abilita il logging dei dati. Attivando il logging dei dati, consenti a Google di registrare tutti i dati audio che invii a Speech-to-Text. Questi dati vengono utilizzati per migliorare i modelli di Speech-to-Text. Gli utenti che attivano il logging dei dati traggono vantaggio da prezzi inferiori. Per ulteriori informazioni, consulta le pagine relative a prezzi e termini e condizioni per la registrazione dei dati.

  7. Ora devi collegare uno o più account di servizio all'API Speech-to-Text. Fai clic sulla voce di menu Credenziali sul lato sinistro della pagina principale dell'API Speech-to-Text. Se non hai account di servizio associati a questo progetto, creane uno seguendo le istruzioni nella sezione creazione di un nuovo account di servizio.

    Gli account di servizio creati in precedenza associati a questo progetto verranno visualizzati in questa pagina. Assicurati di avere accesso a una chiave JSON scaricata associata all'account di servizio che vuoi utilizzare per l'autenticazione con Speech-to-Text. Le chiavi degli account di servizio sono scaricabili una sola volta, al momento della creazione. Se l'account di servizio ha una chiave esistente ma non riesci a trovare il file .json scaricato, dovrai creare una nuova chiave per tale account di servizio e scaricare il relativo file .json. Per istruzioni su come creare una nuova chiave in un account di servizio esistente, segui le istruzioni nella sezione Creazione di una chiave JSON.

    Se hai già un account di servizio e la relativa chiave JSON, ora puoi impostare la variabile di ambiente di autenticazione.

Crea un account di servizio

  1. Crea un nuovo account di servizio se il progetto non ne ha già uno. Per utilizzare Speech-to-Text, devi creare un account di servizio.

    Vai a Crea account di servizio

    Nella casella Nome account di servizio, digita un nome univoco per il nuovo account di servizio. Il tuo input viene completato automaticamente nella casella ID account di servizio. La casella Descrizione account di servizio è facoltativa ma consigliata se intendi associare più account di servizio al progetto. Inserisci una breve descrizione dell'account di servizio in questa casella, poi fai clic su CREA E CONTINUA.

  2. Ti consigliamo di assegnare uno dei ruoli IAM di base al tuo account di servizio. Se necessario, puoi anche assegnare più ruoli a un singolo account di servizio. Consulta i ruoli IAM per i dettagli sui ruoli disponibili e sulle autorizzazioni consentite per ciascuno. Fai clic sul menu a discesa Seleziona un ruolo e scorri verso il basso fino a Di base. Puoi scegliere un ruolo per questo account di servizio dalle opzioni visualizzate nella colonna a destra. Fai clic su CONTINUA.

  3. Il passaggio finale ti consente facoltativamente di consentire ad altre entità (privati, gruppi Google e così via) di accedere al tuo account di servizio. Se non hai bisogno di concedere l'accesso aggiuntivo, puoi fare clic su FINE senza inserire alcuna informazione.

  4. L'account di servizio è ora elencato nella pagina Account di servizio. Puoi modificare le autorizzazioni dell'account di servizio, aggiungere o generare nuove chiavi e concedere l'accesso in qualsiasi momento.

Creare una chiave JSON per l'account di servizio

  1. L'account di servizio appena creato viene visualizzato nella pagina degli account di servizio. Crea una chiave privata che sarà associata a quell'account. Devi utilizzare questa chiave privata durante il processo di autenticazione quando invii una richiesta a Speech-to-Text. Se scegli di non creare una chiave adesso, puoi generare una chiave e/o modificare le informazioni dei singoli utenti in qualsiasi momento accedendo all'account di servizio tramite l'opzione IAM e amministrazione - Account di servizio nel menu di navigazione principale.

    Per creare una chiave, fai clic sull'account di servizio e seleziona la scheda CHIAVE. Fai clic su AGGIUNGI CHIAVE -> Crea nuova chiave. Ti consigliamo di creare una chiave in formato JSON.

  2. Viene scaricata automaticamente una nuova chiave nel formato che preferisci. Salva questo file in un posto sicuro e prendi nota del percorso del file. Dovrai indirizzare la variabile di ambiente GOOGLE_APPLICATION_CREDENTIALS a questo file quando esegui il processo di autenticazione all'inizio di ogni nuova sessione di Speech-to-Text. Questo è un passaggio essenziale per l'autenticazione delle richieste a Speech-to-Text. L'ID univoco della chiave viene visualizzato accanto al nome dell'account di servizio.

Imposta la variabile di ambiente di autenticazione

Per impostare il tuo GOOGLE_APPLICATION_CREDENTIALS, devi avere un account di servizio associato al progetto e avere accesso alla chiave JSON dell'account di servizio.

Fornisci le credenziali di autenticazione al codice della tua applicazione impostando la variabile di ambiente GOOGLE_APPLICATION_CREDENTIALS. Questa variabile si applica solo alla sessione shell corrente. Se vuoi che la variabile venga applicata alle sessioni shell future, impostala nel file di avvio della shell, ad esempio nel file ~/.bashrc o ~/.profile.

Linux o macOS

export GOOGLE_APPLICATION_CREDENTIALS="KEY_PATH"

Sostituisci KEY_PATH con il percorso del file JSON che contiene la chiave dell'account di servizio.

Ad esempio:

export GOOGLE_APPLICATION_CREDENTIALS="/home/user/Downloads/service-account-file.json"

Windows

Per PowerShell:

$env:GOOGLE_APPLICATION_CREDENTIALS="KEY_PATH"

Sostituisci KEY_PATH con il percorso del file JSON che contiene la chiave dell'account di servizio.

Ad esempio:

$env:GOOGLE_APPLICATION_CREDENTIALS="C:\Users\username\Downloads\service-account-file.json"

Per il prompt dei comandi:

set GOOGLE_APPLICATION_CREDENTIALS=KEY_PATH

Sostituisci KEY_PATH con il percorso del file JSON che contiene la chiave dell'account di servizio.

Per ulteriori informazioni, consulta la documentazione sull'autenticazione di Google Cloud Platform.

Facoltativo: crea un bucket Cloud Storage

Se intendi trascrivere audio con una durata superiore a 60 secondi o con file di dimensioni superiori a 10 MB, devi archiviare i dati audio in un bucket Cloud Storage prima di trascriverli utilizzando Speech-to-Text. I passaggi seguenti illustrano la procedura per creare un nuovo bucket.

  • Nella console, vai alla pagina Browser Cloud Storage.

    Vai al browser

  • Fai clic su Crea bucket.
  • Nella pagina Crea un bucket, inserisci le informazioni sul bucket. Per andare al passaggio successivo, fai clic su Continua.
    • In Assegna un nome al bucket, inserisci un nome univoco per il bucket. Non includere informazioni sensibili nel nome del bucket, poiché lo spazio dei nomi del bucket è globale e visibile pubblicamente.
    • Per scegliere dove archiviare i dati, segui questi passaggi:
      • Seleziona un'opzione Tipo di località.
      • Seleziona un'opzione Località.
    • Per Scegliere una classe di archiviazione predefinita per i tuoi dati, seleziona una classe di archiviazione.
    • In Scegli come controllare l'accesso agli oggetti, seleziona un'opzione di Controllo dell'accesso.
    • (Facoltativo) Per le Impostazioni avanzate, specifica un metodo di crittografia, un criterio di conservazione o etichette di bucket.
  • Fai clic su Crea.
  • Disabilita l'API Speech-to-Text

    Completa i seguenti passaggi se non avrai più bisogno di utilizzare l'API Speech-to-Text in futuro.

    1. Passa alla dashboard di Google Cloud e fai clic sul link Vai alle API panoramica nella casella API.
    2. Seleziona l'API Cloud Speech-to-Text.
    3. Fai clic sul pulsante DISABILITA API nella parte superiore della pagina dell'API Cloud Speech-to-Text.

    Passaggi successivi

    Scopri come inviare una richiesta di trascrizione all'API Speech-to-Text utilizzando librerie client, gcloud, la riga di comando o l'UI di Speech-to-Text.