Configurare Speech-to-Text

Mantieni tutto organizzato con le raccolte Salva e classifica i contenuti in base alle tue preferenze.

Speech-to-Text è un'API basata sulla tecnologia di intelligenza artificiale (AI) di Google. Invia i dati audio a Speech-to-Text, quindi ricevi una trascrizione del testo dei tuoi dati audio in risposta.

Per ulteriori informazioni su come creare una richiesta di Speech-to-Text, consulta la pagina Richieste.

Panoramica

Prima di poter iniziare a inviare richieste a Speech-to-Text, devi abilitare l'API nella console Google Cloud. I passaggi di questa pagina illustrano come eseguire le azioni seguenti:

  • Abilita Speech-to-Text su un progetto.
    1. Assicurati che la fatturazione sia abilitata per Speech-to-Text.
    2. Assicurati che il tuo progetto abbia almeno un account di servizio.
    3. Scarica una chiave delle credenziali dell'account di servizio.
  • Imposta la variabile di ambiente di autenticazione.
  • (Facoltativo) Crea un nuovo bucket Google Cloud Storage per archiviare i tuoi dati audio.

Prima di iniziare

Esistono due modi per accedere al servizio: utilizzando l'API REST o la console di Speech-to-Text. Forniamo esempi di codice che mostrano come inviare una richiesta all'API REST e ricevere una risposta. Puoi imparare a utilizzare questi esempi seguendo le guide rapide e le guide illustrative di Speech-to-Text. Se preferisci utilizzare Speech-to-Text con una programmazione minima, puoi usare la console Cloud Speech-to-Text.

Questa guida illustra i passaggi necessari per iniziare a inviare richieste all'API REST. Se non hai familiarità con la programmazione, ti consigliamo di iniziare con i tutorial dettagliati nella console in Google Cloud Platform prima di iniziare questa guida rapida.

Configurare il progetto Google Cloud per Speech-to-Text

  1. Accedi alla console Google Cloud

  2. Vai alla pagina del selettore dei progetti

    Puoi scegliere un progetto esistente o crearne uno nuovo. Per scoprire di più sulla creazione di un progetto, consulta Creazione e gestione dei progetti.

  3. Se crei un nuovo progetto, ti verrà chiesto di collegare un account di fatturazione a questo progetto. Se utilizzi un progetto preesistente, assicurati di avere abilitato la fatturazione.

    Scopri come confermare che la fatturazione è abilitata per il progetto

  4. Dopo aver selezionato un progetto e averlo collegato a un account di fatturazione, puoi abilitare l'API Speech-to-Text. Vai alla barra Cerca prodotti e risorse nella parte superiore della pagina e digita "speech". Seleziona l'API Cloud Speech-to-Text dall'elenco dei risultati.

  5. Per provare Speech-to-Text senza collegarlo al tuo progetto, scegli l'opzione PROVA QUESTA API. Per abilitare l'API Speech-to-Text da utilizzare con il progetto, fai clic su ENABLE.

  6. (Facoltativo) Abilita il logging dei dati. Attivando il logging dei dati, consenti a Google di registrare i dati audio inviati a Speech-to-Text. Questi dati vengono utilizzati per migliorare i modelli di Speech-to-Text. Gli utenti che attivano il logging dei dati beneficiano di una riduzione dei prezzi. Per ulteriori informazioni, consulta le pagine relative ai prezzi e ai termini e condizioni del logging dei dati.

  7. Ora devi collegare uno o più account di servizio all'API Speech-to-Text. Fai clic sulla voce di menu Credenziali sul lato sinistro della pagina principale dell'API Speech-to-Text. Se non hai account di servizio associati a questo progetto, creane uno seguendo le istruzioni nella sezione Creazione di un nuovo account di servizio.

    Se hai già degli account di servizio creati in precedenza associati a questo progetto, questi verranno visualizzati su questa pagina. Assicurati di avere accesso a una chiave JSON scaricata associata all'account di servizio che vuoi utilizzare per l'autenticazione con Speech-to-Text. Le chiavi degli account di servizio possono essere scaricate soltanto una volta, al momento della creazione. Se l'account di servizio ha una chiave esistente, ma non riesci a trovare il file .json scaricato, dovrai creare una nuova chiave per tale account di servizio e scaricare il relativo file .json. Per istruzioni su come creare una nuova chiave in un account di servizio esistente, segui le istruzioni nella sezione Creazione di una chiave JSON.

    Se hai già un account di servizio e la relativa chiave JSON, ora puoi impostare la variabile di ambiente di autenticazione.

Crea un account di servizio

  1. Crea un nuovo account di servizio se il progetto non ne ha già uno. Per utilizzare Speech-to-Text, devi creare un account di servizio.

    Vai a Crea account di servizio

    Nella casella Nome account di servizio, digita un nome univoco per il nuovo account di servizio. Il valore viene inserito automaticamente nella casella ID account di servizio. La casella Descrizione account di servizio è facoltativa, ma consigliata se prevedi di associare più account di servizio al tuo progetto. Inserisci una breve descrizione dell'account di servizio in questa casella, poi fai clic su CREA E CONTINUA.

  2. Ti consigliamo di assegnare uno dei ruoli IAM di base al tuo account di servizio. Se necessario, puoi anche assegnare più ruoli a un singolo account di servizio. Consulta la pagina relativa ai ruoli IAM per i dettagli sui ruoli disponibili e sulle autorizzazioni concesse per ciascuno. Fai clic sul menu a discesa Seleziona un ruolo e scorri verso il basso fino a Base. Puoi scegliere un ruolo per questo account di servizio dalle opzioni visualizzate nella colonna a destra. Fai clic su CONTINUA.

  3. Il passaggio finale ti consente, facoltativamente, consentire ad altre entità (persone, gruppi Google e così via) di accedere al tuo account di servizio. Se non hai bisogno di concedere l'accesso aggiuntivo, puoi fare clic su FINE senza inserire alcuna informazione.

  4. L'account di servizio è ora elencato nella pagina Account di servizio. Puoi modificare le autorizzazioni dell'account di servizio, aggiungere o generare nuove chiavi e concedere l'accesso in qualsiasi momento.

Crea una chiave JSON per l'account di servizio

  1. L'account di servizio appena creato viene visualizzato nella pagina degli account di servizio. Creare una chiave privata che verrà associata a quell'account. Devi utilizzare questa chiave privata durante il processo di autenticazione quando invii una richiesta a Speech-to-Text. Se scegli di non creare una chiave adesso, puoi generarla e/o modificare le informazioni dei singoli utenti in qualsiasi momento accedendo all'account di servizio tramite IAM e amministrazione -> Account di servizio nel menu di navigazione principale.

    Per creare una chiave, fai clic sull'account di servizio e seleziona la scheda CHIAVE. Fai clic su AGGIUNGI CHIAVE -> Crea nuova chiave. Ti consigliamo di creare una chiave in formato JSON.

  2. Viene scaricata automaticamente una nuova chiave nel formato che preferisci. Archivia questo file in una posizione sicura e prendi nota del percorso del file. Dovrai indirizzare la variabile di ambiente GOOGLE_APPLICATION_CREDENTIALS a questo file quando esegui il processo di autenticazione all'inizio di ogni nuova sessione di Speech-to-Text. Questo è un passaggio essenziale per l'autenticazione delle richieste a Speech-to-Text. L'ID univoco della chiave viene visualizzato accanto al nome dell'account di servizio.

Imposta la variabile di ambiente di autenticazione

Per impostare il tuo GOOGLE_APPLICATION_CREDENTIALS, devi avere un account di servizio associato al tuo progetto e avere accesso alla chiave JSON dell'account di servizio.

Fornisci le credenziali di autenticazione al codice della tua applicazione impostando la variabile di ambiente GOOGLE_APPLICATION_CREDENTIALS. Questa variabile si applica solo alla sessione shell corrente. Se vuoi che la variabile venga applicata alle sessioni shell future, impostala nel file di avvio della shell, ad esempio nel file ~/.bashrc o ~/.profile.

Linux o macOS

export GOOGLE_APPLICATION_CREDENTIALS="KEY_PATH"

Sostituisci KEY_PATH con il percorso del file JSON che contiene la chiave dell'account di servizio.

Ad esempio:

export GOOGLE_APPLICATION_CREDENTIALS="/home/user/Downloads/service-account-file.json"

Windows

Per PowerShell:

$env:GOOGLE_APPLICATION_CREDENTIALS="KEY_PATH"

Sostituisci KEY_PATH con il percorso del file JSON che contiene la chiave dell'account di servizio.

Ad esempio:

$env:GOOGLE_APPLICATION_CREDENTIALS="C:\Users\username\Downloads\service-account-file.json"

Per il prompt dei comandi:

set GOOGLE_APPLICATION_CREDENTIALS=KEY_PATH

Sostituisci KEY_PATH con il percorso del file JSON che contiene la chiave dell'account di servizio.

Per ulteriori informazioni, consulta la documentazione di autenticazione di Google Cloud Platform.

(Facoltativo) Crea un bucket Cloud Storage

Se intendi trascrivere audio di durata superiore a 60 secondi o con dimensioni file superiori a 10 MB, devi archiviare i dati audio in un bucket Cloud Storage prima di poterli trascrivere utilizzando Speech-to-Text. I passaggi seguenti spiegano come creare un nuovo bucket.

  • Nella console, vai alla pagina Browser Cloud Storage.

    Vai al browser

  • Fai clic su Crea bucket.
  • Nella pagina Crea un bucket, inserisci le informazioni sul bucket. Per andare al passaggio successivo, fai clic su Continua.
    • In Assegna un nome al bucket, inserisci un nome univoco per il bucket. Non includere informazioni sensibili nel nome del bucket, poiché lo spazio dei nomi del bucket è globale e visibile pubblicamente.
    • Per scegliere dove archiviare i dati, segui questi passaggi:
      • Seleziona un'opzione Tipo di località.
      • Seleziona un'opzione Località.
    • Per Scegliere una classe di archiviazione predefinita per i tuoi dati, seleziona una classe di archiviazione.
    • In Scegli come controllare l'accesso agli oggetti, seleziona un'opzione di Controllo dell'accesso.
    • (Facoltativo) Per le Impostazioni avanzate, specifica un metodo di crittografia, un criterio di conservazione o etichette di bucket.
  • Fai clic su Crea.
  • Disabilita l'API Speech-to-Text

    Completa i seguenti passaggi se non hai più bisogno di utilizzare l'API Speech-to-Text in futuro.

    1. Vai alla dashboard di Google Cloud e fai clic sul link Vai alla panoramica delle API nella casella API.
    2. Seleziona API Cloud Speech-to-Text.
    3. Fai clic sul pulsante DISATTIVA API nella parte superiore della pagina dell'API Cloud Speech-to-Text.

    Passaggi successivi

    Scopri come inviare una richiesta di trascrizione all'API Speech-to-Text utilizzando librerie client, gcloud, la riga di comando o l'UI di Speech-to-Text.