Trascrizione della voce in testo utilizzando la console Google Cloud
Questa guida rapida illustra la console di Cloud Speech-to-Text. In questa guida rapida, creerai e perfezionerai una trascrizione e imparerai a utilizzare questa configurazione con l'API Speech-to-Text per le tue applicazioni.
Per informazioni su come inviare richieste e ricevere risposte utilizzando l'API REST anziché la console, consulta la pagina Prima di iniziare.
Prima di iniziare
Prima di poter iniziare a utilizzare la console di Speech-to-Text, devi abilitare l'API nella console di Google Cloud Platform. I passaggi riportati di seguito illustrano le seguenti azioni:
- Abilitare Speech-to-Text in un progetto.
- Assicurati che la fatturazione sia abilitata per Speech-to-Text.
Configura il progetto Google Cloud
Vai alla pagina del selettore progetti
Puoi scegliere un progetto esistente o crearne uno nuovo. Per ulteriori dettagli sulla creazione di un progetto, consulta la documentazione della piattaforma Google Cloud.
Se crei un nuovo progetto, ti verrà chiesto di collegare un account di fatturazione a questo progetto. Se utilizzi un progetto preesistente, assicurati che la fatturazione sia abilitata.
Scopri come verificare che la fatturazione sia abilitata per il tuo progetto
Dopo aver selezionato un progetto e averlo collegato a un account di fatturazione, puoi abilitare l'API Speech-to-Text. Vai alla barra Cerca prodotti e risorse nella parte superiore della pagina e digita "Speech".
Seleziona l'API Cloud Speech-to-Text dall'elenco dei risultati.
Per provare Speech-to-Text senza collegarlo al tuo progetto, scegli l'opzione PROVA QUESTA API. Per abilitare l'API Speech-to-Text da usare con il tuo progetto, fai clic su ABILITA.
Creare una trascrizione
Utilizza la console Google Cloud per creare una nuova trascrizione:
Configurazione audio
Apri la panoramica di Speech-to-Text.
Fai clic su Crea trascrizione.
- Se è la prima volta che utilizzi la console, ti verrà chiesto di scegliere dove archiviare le configurazioni e le trascrizioni in Cloud Storage.
Nella pagina Crea trascrizione, consulta Carica un file audio di origine. Puoi scegliere un file già salvato in Cloud Storage o caricarne uno nuovo nella destinazione Cloud Storage specificata.
Seleziona il tipo di codifica del file audio caricato.
Specifica la relativa frequenza di campionamento.
Fai clic su Continua. Vengono visualizzate le Opzioni di trascrizione.
Opzioni di trascrizione
Seleziona il codice lingua dell'audio di origine. Questa è la lingua parlata nella registrazione.
Scegli il modello di trascrizione che vuoi utilizzare nel file. L'opzione Preselezionata è preselezionata e, in genere, non sono necessarie modifiche; ma l'abbinamento del modello al tipo di audio potrebbe comportare una maggiore precisione. Tieni presente che i costi del modello variano.
Fai clic su Continua. Verrà visualizzata la pagina Adattamento del modello.
Adattamento del modello (facoltativo)
Se l'audio di origine contiene elementi come parole rare, nomi propri o termini proprietari e riscontri problemi di riconoscimento, l'adattamento del modello può essere di aiuto.
Seleziona Attiva l'adattamento del modello.
Scegli Risorsa di adattamento una tantum.
Aggiungi frasi pertinenti e assegna loro un valore di potenziamento.
Nella colonna a sinistra, fai clic su Invia per creare la trascrizione.
Rivedi la trascrizione
A seconda delle dimensioni del file audio, la creazione di una trascrizione può richiedere da minuti a ore. Una volta creata, la trascrizione è pronta per la revisione. Ordinare la tabella per timestamp può aiutarti a individuare facilmente le trascrizioni recenti.
Fai clic sul Nome della trascrizione che vuoi esaminare.
Confronta il testo della Trascrizione con il file audio.
Se vuoi apportare modifiche, fai clic su Riutilizza configurazione. Si aprirà il flusso Crea trascrizione con le stesse opzioni preselezionate, in modo da poter modificare alcuni dati, creare una nuova trascrizione e confrontare i risultati.
Passaggi successivi
- Esercitati a trascrivere file audio brevi.
- Scopri come eseguire il batch di file audio lunghi per il riconoscimento vocale.
- Scopri come trascrivere audio in streaming, ad esempio da un microfono.
- Inizia a utilizzare Speech-to-Text nella lingua che preferisci utilizzando una libreria client di Speech-to-Text.
- Esamina le applicazioni di esempio.
- Per prestazioni ottimali, precisione e altri suggerimenti, consulta la documentazione sulle best practice.