L'API Speech-to-Text v2 offre il Google Cloud design dell'API più recente per consentire ai clienti di soddisfare immediatamente i requisiti normativi e di sicurezza delle aziende.
Questi requisiti vengono soddisfatti tramite quanto segue:
Residenza dei dati: Speech-to-Text 2 offre l'ampia gamma dei nostri modelli di trascrizione esistenti nelle Google Cloud regioni come il Belgio o Singapore. Ciò consente di chiamare i nostri modelli di trascrizione tramite un servizio completamente regionalizzato.
Risorse per i riconoscitori: i riconoscitori sono configurazioni di riconoscimento riutilizzabili che possono contenere una combinazione di modello, lingua e funzionalità.
Logging: la creazione e le trascrizioni delle risorse generano log disponibili nella console Google Cloud, consentendo una migliore telemetria e un migliore debug.
Crittografia: Speech-to-Text v2 supporta le chiavi di crittografia gestite dal cliente per tutte le risorse, oltre alla trascrizione batch.
Rilevamento automatico dell'audio: la versione 2 di Speech-to-Text può rilevare automaticamente la frequenza di campionamento, il numero di canali e il formato dei file audio, senza dover fornire queste informazioni nella configurazione della richiesta.
Migrazione da v1 a v2
La migrazione dall'API v1 all'API v2 non avviene automaticamente. Per sfruttare al meglio l'insieme di funzionalità, sono necessarie modifiche minime all'implementazione.
Migrazione nell'API
Come per Speech-to-Text versione 1, per trascrivere l'audio,
devi creare un RecognitionConfig
selezionando la lingua dell'audio e il modello di riconoscimento scelto:
Python
Se necessario, seleziona una regione in cui vuoi utilizzare l'API Speech-to-Text e controlla la disponibilità della lingua e del modello in quella regione:
Python
Se vuoi, crea una risorsa di riconoscimento se devi riutilizzare una configurazione di riconoscimento specifica in molte richieste di trascrizione:
Python
Esistono altre differenze nelle richieste e nelle risposte della nuova API v2. Per ulteriori dettagli, consulta la documentazione di riferimento.
Migrazione nell'interfaccia utente
Per eseguire la migrazione tramite la console Google Cloud Speech:
Vai alla console Google Cloud Speech.
Vai alla pagina Trascrizioni.
Fai clic su Nuova trascrizione e seleziona l'audio nella scheda Configurazione audio.
Nella scheda Opzioni di trascrizione, seleziona V2.
Passaggi successivi
- Utilizza le librerie client per trascrivere l'audio utilizzando il tuo linguaggio di programmazione preferito.
- Fai pratica di trascrizione di file audio brevi.
- Scopri come trascrivere l'audio in streaming.
- Scopri come trascrivere file audio lunghi.