Prima di iniziare

Speech-to-Text è un'API che si basa sulla tecnologia di intelligenza artificiale (AI) di Google. Invia i dati audio a Speech-to-Text, quindi ricevi una trascrizione del testo dei dati audio in risposta. Per ulteriori informazioni sul funzionamento di Speech-to-Text, consulta la pagina Nozioni di base.

Esistono due modi per accedere al servizio: utilizzando l'API REST o utilizzando la console di Speech-to-Text. Forniamo esempi di codice che mostrano come effettuare una richiesta all'API REST e ricevere una risposta. Puoi imparare a utilizzare questi esempi seguendo le guide Speech-to-Text e le guide illustrative. Se preferisci utilizzare Speech-to-Text con una programmazione minima, puoi utilizzare Cloud Speech-to-Text Console.

Questa guida illustra i passaggi necessari per iniziare a inviare richieste all'API REST. Per iniziare a utilizzare la console di Speech-to-Text, consulta la guida rapida di UI Console.

Panoramica

Prima di poter iniziare a inviare richieste a Speech-to-Text, devi abilitare l'API in Google Cloud Console. In questa pagina ti mostreremo i passaggi da seguire:

  • Abilita Speech-to-Text su un progetto.
    1. Assicurati che la fatturazione sia attivata per Speech-to-Text.
    2. Assicurati che il tuo progetto abbia almeno un account di servizio.
    3. Scarica una chiave delle credenziali dell'account di servizio.
  • Imposta la variabile di ambiente di autenticazione.
  • (Facoltativo) Crea un nuovo bucket Google Cloud Storage per archiviare i tuoi dati audio.

Configura il tuo progetto Google Cloud

  1. Accedi a Cloud Console

  2. Vai alla pagina del selettore dei progetti

    Puoi scegliere un progetto esistente o crearne uno nuovo. Per scoprire di più sulla creazione di un progetto, consulta Creazione e gestione di progetti.

  3. Se crei un nuovo progetto, ti verrà chiesto di collegare un account di fatturazione a questo progetto. Se utilizzi un progetto preesistente, assicurati di aver abilitato la fatturazione.

    Scopri come verificare se la fatturazione è abilitata per il tuo progetto

  4. Dopo aver selezionato un progetto e averlo collegato a un account di fatturazione, puoi abilitare l'API Speech-to-Text. Vai alla barra Cerca prodotti e risorse nella parte superiore della pagina e digita "Speech". Seleziona l'API Cloud Speech-to-Text dall'elenco dei risultati.

  5. Per provare Speech-to-Text senza collegarlo al tuo progetto, scegli l'opzione PROVA QUESTA API. Per abilitare l'API Speech-to-Text da utilizzare con il tuo progetto, fai clic su ABILITA.

  6. (Facoltativo) Attiva il logging dei dati. Se attivi il logging dei dati, consenti a Google di registrare tutti i dati audio che invii a Speech-to-Text. Questi dati vengono utilizzati per migliorare i modelli Speech-to-Text. Gli utenti che attivano il logging dei dati beneficiano di prezzi inferiori. Per ulteriori informazioni, consulta le pagine relative a prezzi e termini e condizioni.

  7. Ora devi collegare uno o più account di servizio all'API Speech-to-Text. Fai clic sulla voce di menu Credenziali sul lato sinistro della pagina principale dell'API Speech-to-Text. Se non hai alcun account di servizio associato a questo progetto, creane uno seguendo le istruzioni nella sezione Creazione di un nuovo account di servizio.

    Se hai già degli account di servizio creati in precedenza associati a questo progetto, verranno visualizzati in questa pagina. Assicurati di avere accesso a una chiave JSON scaricata associata all'account di servizio che vuoi utilizzare per l'autenticazione con Speech-to-Text. Le chiavi degli account di servizio possono essere scaricate una sola volta, al momento della creazione. Se il tuo account di servizio contiene una chiave esistente, ma non riesci a trovare il file .json scaricato, dovrai creare una nuova chiave per tale account e scaricare il relativo file .json. Per istruzioni su come creare una nuova chiave in un account di servizio esistente, segui le istruzioni nella sezione Creare una chiave JSON.

    Se hai già un account di servizio e la relativa chiave JSON, ora puoi impostare la tua variabile di ambiente di autenticazione.

Crea un account di servizio

  1. Crea un nuovo account di servizio se il tuo progetto non ne ha già uno. Per utilizzare Speech-to-Text devi creare un account di servizio.

    Vai a Crea account di servizio

    Nella casella Nome account di servizio, digita un nome univoco per il nuovo account di servizio. Il valore viene inserito automaticamente nella casella ID account di servizio. La casella Descrizione account di servizio è facoltativa, ma consigliata se prevedi di associare più account di servizio al tuo progetto. Inserisci una breve descrizione dell'account di servizio in questa casella, quindi fai clic su CREA E CONTINUA.

  2. Ti consigliamo di assegnare uno dei ruoli IAM di base al tuo account di servizio. Se necessario, puoi anche assegnare più ruoli a un singolo account di servizio. Consulta i ruoli IAM per i dettagli sui ruoli disponibili e sulle autorizzazioni consentite per ciascuno. Fai clic sul menu a discesa Seleziona un ruolo e scorri verso il basso fino a Di base. Puoi scegliere un ruolo per questo account di servizio dalle opzioni visualizzate nella colonna a destra. Fai clic su CONTINUA.

  3. Il passaggio finale ti permette di consentire ad altre entità (individuali, gruppi Google e così via) di accedere al tuo account di servizio. Se non devi concedere un accesso aggiuntivo, puoi fare clic su FINE senza inserire informazioni.

  4. L'account di servizio è ora elencato nella pagina Account di servizio. Puoi modificare le autorizzazioni dell'account di servizio, aggiungere o generare nuove chiavi e concedere l'accesso in qualsiasi momento.

Crea una chiave JSON per il tuo account di servizio

  1. L'account di servizio appena creato viene visualizzato nella pagina degli account di servizio. Crea una chiave privata che verrà associata all'account. Devi utilizzare questa chiave privata durante il processo di autenticazione quando invii una richiesta a Speech-to-Text. Se scegli di non creare una chiave ora, puoi generare una chiave e/o modificare le informazioni relative ai singoli utenti in qualsiasi momento accedendo all'account di servizio tramite l'opzione IAM e amministrazione - e account di servizio nel menu di navigazione principale.

    Per creare una chiave, fai clic sull'account di servizio e seleziona la scheda CHIAVE. Fai clic su AGGIUNGI CHIAVE -> Crea nuova chiave. Ti consigliamo di creare una chiave in formato JSON.

  2. Verrà scaricata automaticamente una nuova chiave nel formato che preferisci. Conserva questo file in una posizione sicura e prendi nota del percorso del file. Dovrai indirizzare la variabile di ambiente GOOGLE_APPLICATION_CREDENTIALS a questo file quando esegui il processo di autenticazione all'inizio di ogni nuova sessione di Speech-to-Text. Si tratta di un passaggio essenziale per l'autenticazione delle richieste in Speech-to-Text. L'ID univoco della chiave viene visualizzato accanto al nome dell'account di servizio.

Imposta la variabile di ambiente di autenticazione

Per impostare il tuo GOOGLE_APPLICATION_CREDENTIALS, devi avere un account di servizio associato al progetto e disporre dell'accesso alla chiave JSON dell'account di servizio.

Fornisci le credenziali di autenticazione al codice della tua applicazione impostando la variabile di ambiente GOOGLE_APPLICATION_CREDENTIALS. Questa variabile si applica solo alla sessione shell corrente. Se vuoi che la variabile venga applicata alle sessioni shell future, impostala nel file di avvio della shell, ad esempio nel file ~/.bashrc o ~/.profile.

Linux o macOS

export GOOGLE_APPLICATION_CREDENTIALS="KEY_PATH"

Sostituisci KEY_PATH con il percorso del file JSON che contiene la chiave dell'account di servizio.

Ad esempio:

export GOOGLE_APPLICATION_CREDENTIALS="/home/user/Downloads/service-account-file.json"

Windows

Per PowerShell:

$env:GOOGLE_APPLICATION_CREDENTIALS="KEY_PATH"

Sostituisci KEY_PATH con il percorso del file JSON che contiene la chiave dell'account di servizio.

Ad esempio:

$env:GOOGLE_APPLICATION_CREDENTIALS="C:\Users\username\Downloads\service-account-file.json"

Per il prompt dei comandi:

set GOOGLE_APPLICATION_CREDENTIALS=KEY_PATH

Sostituisci KEY_PATH con il percorso del file JSON che contiene la chiave dell'account di servizio.

Per ulteriori informazioni, consulta la documentazione sull'autenticazione di Google Cloud Platform.

Facoltativo: crea un bucket Cloud Storage

Se intendi trascrivere audio di durata superiore a 60 secondi o con dimensioni dei file superiori a 10 MB, devi archiviare i dati audio in un bucket Cloud Storage prima di poterli trascrivere utilizzando Speech-to-Text. Per creare un nuovo bucket, segui i passaggi riportati di seguito.

  • In Cloud Console, vai alla pagina Browser di Cloud Storage.

    Vai al browser

  • Fai clic su Crea bucket.
  • Nella pagina Crea un bucket, inserisci le informazioni sul bucket. Per andare al passaggio successivo, fai clic su Continua.
    • In Assegna un nome al bucket, inserisci un nome univoco per il bucket. Non includere informazioni sensibili nel nome del bucket, poiché lo spazio dei nomi del bucket è globale e visibile pubblicamente.
    • Per scegliere dove archiviare i dati, segui questi passaggi:
      • Seleziona un'opzione Tipo di località.
      • Seleziona un'opzione Località.
    • Per Scegliere una classe di archiviazione predefinita per i tuoi dati, seleziona una classe di archiviazione.
    • In Scegli come controllare l'accesso agli oggetti, seleziona un'opzione di Controllo dell'accesso.
    • (Facoltativo) Per le Impostazioni avanzate, specifica un metodo di crittografia, un criterio di conservazione o etichette di bucket.
  • Fai clic su Crea.
  • Disattiva l'API Speech-to-Text

    Completa i seguenti passaggi se non devi più utilizzare l'API Speech-to-Text in futuro.

    1. Passa alla dashboard di Google Cloud e fai clic sul link Vai alla panoramica delle API nella casella API.
    2. Seleziona API Cloud Speech-to-Text.
    3. Fai clic sul pulsante DISABILITA API nella parte superiore della pagina dell'API Cloud Speech-to-Text.

    Passaggi successivi

    Scopri come inviare una richiesta di trascrizione all'API Speech-to-Text utilizzando librerie client, gcloud, la riga di comando o l'UI di Speech-to-Text.