L'API Speech-to-Text v2 offre ai clienti la versione più recente del design dell'API Google Cloud per soddisfare immediatamente i requisiti normativi e di sicurezza delle aziende.
Questi requisiti vengono soddisfatti tramite quanto segue:
Residenza dei dati: Speech-to-Text v2 offre l'ampia dei nostri modelli di trascrizione esistenti in Regioni di Google Cloud come Belgio o Singapore. Ciò consente di chiamare i nostri modelli di trascrizione tramite un servizio completamente regionalizzato.
Risorse del riconoscimento: i riconoscimenti sono riutilizzabili configurazioni di riconoscimento che possono contenere una combinazione di modelli, linguaggio e caratteristiche. Questa implementazione intelligente elimina la necessità per account di servizio dedicati per l'autenticazione e l'autorizzazione.
Logging: la creazione e le trascrizioni delle risorse generano log disponibili nella console Google Cloud, consentendo una migliore telemetria e un migliore debug.
Crittografia: Speech-to-Text v2 supporta le chiavi di crittografia gestite dal cliente per tutte le risorse, oltre alla trascrizione batch.
Rilevamento automatico dell'audio: Speech-to-Text versione 2 può rilevare automaticamente la frequenza di campionamento, il numero di canali e il formato dei file audio, senza dover fornire queste informazioni nella configurazione della richiesta.
Migrazione da v1 a v2
La migrazione dall'API v1 all'API v2 non avviene automaticamente. Per sfruttare al meglio l'insieme di funzionalità, sono necessarie modifiche minime all'implementazione.
Migrazione in API
Analogamente a Speech-to-Text v1, per trascrivere l'audio,
devi creare una RecognitionConfig
selezionare la lingua dell'audio e il modello di riconoscimento
scelta:
Python
Se necessario, seleziona una regione in cui vuoi utilizzare l'API Speech-to-Text e controlla la disponibilità della lingua e del modello in quella regione:
Python
Se vuoi, crea una risorsa di riconoscimento se devi riutilizzare una configurazione di riconoscimento specifica in molte richieste di trascrizione:
Python
Esistono altre differenze nelle richieste e nelle risposte nella nuova API v2. Per ulteriori dettagli, consulta la documentazione di riferimento.
Migrazione nell'interfaccia utente
Per eseguire la migrazione tramite la console Google Cloud Speech, segui questi passaggi:
Vai alla console Google Cloud di Speech.
Vai alla pagina Trascrizioni.
Fai clic su Nuova trascrizione e seleziona l'audio nella scheda Configurazione audio.
Nella scheda Opzioni di trascrizione, seleziona V2.