Trascrivere i discorsi in testo utilizzando la console Google Cloud

Questa guida rapida illustra la console Cloud Speech-to-Text. In questa guida introduttiva, creerai e perfezionerai una trascrizione e imparerai a utilizzare questa configurazione con l'API Speech-to-Text per le tue applicazioni.

Per scoprire come inviare richieste e ricevere risposte utilizzando l'API REST anziché la Console, consulta la pagina Prima di iniziare.

Prima di iniziare

Prima di poter iniziare a utilizzare la console Speech-to-Text, devi attivare l'API nella console di Google Cloud Platform. I passaggi riportati di seguito illustrano le seguenti azioni:

  • Attivare Speech-to-Text in un progetto.
  • Assicurati che la fatturazione sia attivata per Speech-to-Text.

Configurare il progetto Google Cloud

  1. Accedi alla console Google Cloud

  2. Vai alla pagina del selettore dei progetti

    Puoi scegliere un progetto esistente o crearne uno nuovo. Per ulteriori dettagli sulla creazione di un progetto, consulta la documentazione della piattaforma Google Cloud.

  3. Se crei un nuovo progetto, ti verrà chiesto di collegare un account di fatturazione a questo progetto. Se utilizzi un progetto esistente, assicurati di avere attivato la fatturazione.

    Scopri come verificare che la fatturazione sia attivata per il tuo progetto

  4. Dopo aver selezionato un progetto e averlo collegato a un account di fatturazione, puoi attivare l'API Speech-to-Text. Vai alla barra Cerca prodotti e risorse nella parte superiore della pagina e digita "speech".

  5. Seleziona l'API Cloud Speech-to-Text dall'elenco dei risultati.

  6. Per provare Speech-to-Text senza collegarlo al tuo progetto, scegli l'opzione PROVA QUESTA API. Per abilitare l'API Speech-to-Text per l'utilizzo con il tuo progetto, fai clic su ABILITA.

Creare una trascrizione

Utilizza la console Google Cloud per creare una nuova trascrizione:

Configurazione audio

  1. Apri la panoramica di Speech-to-Text.

    Screenshot della pagina Panoramica di Speech-to-Text.

  2. Fai clic su Crea trascrizione.

    • Se è la prima volta che utilizzi la console, ti verrà chiesto di scegliere dove archiviare le configurazioni e le trascrizioni in Cloud Storage.
      Screenshot della pagina Crea trascrizione di Speech-to-Text.
  3. Nella pagina Crea trascrizione, carica un file audio di origine. Puoi scegliere un file già salvato in Cloud Storage o caricarne uno nuovo nella destinazione Cloud Storage specificata.

  4. Seleziona il tipo di codifica del file audio caricato.

  5. Specifica la frequenza di campionamento.

  6. Fai clic su Continua. Verrà visualizzata la pagina Opzioni di trascrizione.

Opzioni di trascrizione

  1. Seleziona il codice lingua dell'audio di origine. Si tratta della lingua parlata nella registrazione.

  2. Scegli il modello di trascrizione che vuoi utilizzare sul file. L'opzione Predefinito è preselezionata e, in genere, non è necessaria alcuna modifica, ma l'associazione del modello al tipo di audio può comportare una maggiore precisione. Tieni presente che i costi dei modelli variano.

    Screenshot della pagina Crea trascrizione di Speech-to-Text.

  3. Fai clic su Continua. Verrà visualizzata la pagina Adattamento del modello.

Adattamento del modello (facoltativo)

Se l'audio di origine contiene parole rare, nomi propri o termini di proprietà e riscontri problemi di riconoscimento, l'adattamento del modello può aiutarti.

  1. Seleziona Attiva l'adattamento del modello.

  2. Scegli Risorsa di adattamento una tantum.

  3. Aggiungi frasi pertinenti e assegna loro un valore di boost.

    Screenshot della pagina Crea trascrizione di Speech-to-Text.

  4. Nella colonna a sinistra, fai clic su Invia per creare la trascrizione.

Rivedi la trascrizione

A seconda delle dimensioni del file audio, la creazione di una trascrizione può richiedere da alcuni minuti a diverse ore. Una volta creata, la trascrizione è pronta per essere esaminata. Ordinare la tabella in base al timestamp può aiutarti a trovare facilmente le trascrizioni recenti.

  1. Fai clic sul nome della trascrizione che vuoi esaminare.

    Screenshot della pagina Elenco di trascrizioni della conversione della voce in testo.
  2. Confronta il testo della trascrizione con il file audio

    Screenshot della pagina Elenco di trascrizioni della conversione della voce in testo.
  3. Se vuoi apportare modifiche, fai clic su Riutilizza configurazione. Verrà visualizzato il flusso Crea trascrizione con le stesse opzioni preselezionate, che ti consentiranno di apportare alcune modifiche, creare una nuova trascrizione e confrontare i risultati.

Passaggi successivi