L'API Speech-to-Text v2 porta il più recente design dell'API Google Cloud per ai clienti di soddisfare i requisiti normativi e di sicurezza aziendali il riquadro.
Questi requisiti vengono soddisfatti tramite quanto segue:
Residenza dei dati: Speech-to-Text v2 offre l'ampia dei nostri modelli di trascrizione esistenti in Regioni di Google Cloud come Belgio o Singapore. Ciò consente di chiamare i nostri modelli di trascrizione tramite un servizio completamente regionalizzato.
Risorse per i riconoscitori: i riconoscitori sono configurazioni di riconoscimento riutilizzabili che possono contenere una combinazione di modello, lingua e funzionalità.
Logging: la creazione e le trascrizioni delle risorse generano log disponibili nella console Google Cloud, migliorando i dati di telemetria e debug.
Crittografia: Speech-to-Text v2 supporta le chiavi di crittografia gestite dal cliente per tutte le risorse, oltre alla trascrizione batch.
Rilevamento automatico audio: Speech-to-Text v2 può automaticamente rilevare la frequenza di campionamento, il numero di canali e il formato dei file audio; senza dover fornire queste informazioni nella configurazione della richiesta.
Migrazione da v1 a v2
La migrazione dall'API v1 all'API v2 non avviene automaticamente. Minima modifiche all'implementazione sono necessarie per sfruttare l'insieme di funzionalità.
Migrazione nell'API
Come per Speech-to-Text versione 1, per trascrivere l'audio,
devi creare un RecognitionConfig
selezionando la lingua dell'audio e il modello di riconoscimento scelto:
Python
Se necessario, seleziona una regione in cui vuoi utilizzare l'API Speech-to-Text. e controlla la disponibilità delle lingue e dei modelli in quella regione:
Python
Facoltativamente, crea una risorsa di riconoscimento se devi riutilizzare un e una specifica configurazione del riconoscimento in molte richieste di trascrizione:
Python
Esistono altre differenze nelle richieste e nelle risposte della nuova API v2. Per ulteriori dettagli, consulta la documentazione di riferimento.
Migrazione nell'interfaccia utente
Per eseguire la migrazione tramite la console Google Cloud Speech, segui questi passaggi:
Vai alla console Google Cloud di Speech.
Vai alla pagina Trascrizioni.
Fai clic su Nuova trascrizione e seleziona l'audio nella scheda Configurazione audio.
Nella scheda Opzioni di trascrizione, seleziona V2.
Passaggi successivi
- Utilizza le librerie client per trascrivere audio usando il tuo il tuo linguaggio di programmazione preferito.
- Esercitati a trascrivere file audio brevi.
- Scopri come trascrivere l'audio in streaming.
- Scopri come trascrivere file audio lunghi.