Speech-to-Text è un'API basata sulla tecnologia di intelligenza artificiale (AI) di Google. Invii i tuoi dati audio a Speech-to-Text, quindi riceverai una trascrizione testuale dei dati audio in risposta.
Per ulteriori informazioni su come creare una richiesta Speech-to-Text, consulta la pagina relativa alle richieste.
Panoramica
Per poter iniziare a inviare richieste a Speech-to-Text, devi abilitare l'API nella console Google Cloud. I passaggi in questa pagina illustrano le seguenti azioni:
- Abilitare Speech-to-Text in un progetto.
- Assicurati che la fatturazione sia abilitata per Speech-to-Text.
- (Facoltativo) Crea un nuovo bucket Google Cloud Storage per archiviare i dati audio.
Prima di iniziare
Esistono due modi per accedere al servizio: utilizzando l'API REST o la console Speech-to-Text. Forniamo esempi di codice che mostrano come effettuare una richiesta all'API REST e ricevere una risposta. Per scoprire come utilizzare questi esempi, consulta le guide rapide e le guide illustrative di Speech-to-Text. Se preferisci utilizzare Speech-to-Text con una programmazione minima, puoi utilizzare la console di Cloud Speech-to-Text.
Questa guida illustra i passaggi necessari per iniziare a inviare richieste all'API REST. Se non hai mai utilizzato la programmazione, ti consigliamo di iniziare con i tutorial passo passo nella console nella piattaforma Google Cloud prima di iniziare questa guida rapida.
Configura il tuo progetto Google Cloud per Speech-to-Text
Vai alla pagina del selettore progetti
Puoi scegliere un progetto esistente o crearne uno nuovo. Per saperne di più sulla creazione di un progetto, vedi Creazione e gestione dei progetti.
Se crei un nuovo progetto, ti verrà chiesto di collegare un account di fatturazione a questo progetto. Se utilizzi un progetto preesistente, assicurati che la fatturazione sia abilitata.
Scopri come verificare che la fatturazione sia abilitata per il tuo progetto
Dopo aver selezionato un progetto e averlo collegato a un account di fatturazione, puoi abilitare l'API Speech-to-Text. Vai alla barra Cerca prodotti e risorse nella parte superiore della pagina e digita "Speech". Seleziona l'API Cloud Speech-to-Text dall'elenco dei risultati.
Per provare Speech-to-Text senza collegarlo al tuo progetto, scegli l'opzione PROVA QUESTA API. Per abilitare l'API Speech-to-Text da usare con il tuo progetto, fai clic su ABILITA.
(Facoltativo) Abilita il logging dei dati. Se attivi il logging dei dati, consenti a Google di registrare tutti i dati audio che invii a Speech-to-Text. Questi dati vengono utilizzati per migliorare i modelli Speech-to-Text. Gli utenti che attivano il logging dei dati traggono vantaggio da prezzi inferiori. Per ulteriori informazioni, consulta le pagine relative a Termini e condizioni relative ai pricing e al logging dei dati.
(Facoltativo) Crea un bucket Cloud Storage
Se intendi trascrivere contenuti audio di durata superiore a 60 secondi o con dimensioni del file superiori a 10 MB, devi archiviare i dati audio in un bucket Cloud Storage prima di poterli trascrivere utilizzando Speech-to-Text. I passaggi seguenti illustrano la procedura di creazione di un nuovo bucket.
- For Name your bucket, enter a unique bucket name. Don't include sensitive information in the bucket name, because the bucket namespace is global and publicly visible.
-
For Choose where to store your data, do the following:
- Select a Location type option.
- Select a Location option.
- For Choose a default storage class for your data, select a storage class.
- For Choose how to control access to objects, select an Access control option.
- For Advanced settings (optional), specify an encryption method, a retention policy, or bucket labels.
Disabilita l'API Speech-to-Text
Completa i passaggi seguenti se non hai più bisogno di utilizzare l'API Speech-to-Text in futuro.
- Vai alla dashboard Google Cloud e fai clic sul link Vai alla panoramica delle API nel riquadro API.
- Seleziona API Cloud Speech-to-Text.
- Fai clic sul pulsante DISABILITA API nella parte superiore della pagina dell'API Cloud Speech-to-Text.
Passaggi successivi
Scopri come inviare una richiesta di trascrizione all'API Speech-to-Text utilizzando le librerie client, gcloud, la riga di comando o l'UI di Speech-to-Text.