La API de Speech-to-Text v2 ofrece el diseño más reciente de la API de Google Cloud para que los clientes cumplan con los requisitos normativos y de seguridad empresarial con las funciones listas para usar.
Estos requisitos se cumplen a través de lo siguiente:
Residencia de datos: Speech-to-Text v2 ofrece la amplia gama de nuestros modelos de transcripción existentes en Regiones de Google Cloud como Bélgica o Singapur. Esto permite la invocación de nuestros modelos de transcripción a través de un servicio completamente regionalizado.
Capacidad de reconocimiento: Los reconocedores son configuraciones de reconocimiento reutilizables, que pueden contener una combinación de modelo, lenguaje y funciones. La implementación de esta capacidad elimina la necesidad de cuentas de servicio dedicadas para la autenticación y la autorización.
Registro: La creación y las transcripciones de recursos generan registros disponibles en la consola de Google Cloud, lo que permite una mejor telemetría y depuración.
Encriptación: Speech-to-Text v2 admite claves de encriptación administradas por el cliente para todos los recursos y la transcripción por lotes.
Detección automática de audio: Speech-to-Text v2 puede detectar de forma automática la tasa de muestreo, el recuento de canales y el formato de tus archivos de audio, sin necesidad de proporcionar esa información en la configuración de la solicitud.
Migrar de v1 a v2
La migración de la v1 a la v2 de la API no se realiza automáticamente. Se requieren cambios mínimos en la implementación para aprovechar el conjunto de atributos.
Migración en la API
Al igual que con Speech-to-Text v1, para transcribir audio, debes crear un RecognitionConfig
seleccionando el idioma de tu audio y el modelo de reconocimiento que elijas:
Python
Si es necesario, selecciona una región en la que deseas usar la API de Speech-to-Text y verifica la disponibilidad del idioma y el modelo en esa región:
Python
De manera opcional, crea un recurso de reconocimiento si necesitas reutilizar una configuración de reconocimiento específica en muchas solicitudes de transcripción:
Python
Existen otras diferencias en las solicitudes y respuestas de la nueva API v2. Para obtener más detalles, consulta la documentación de referencia.
Migración en la IU
Para migrar a través de Speech en la consola de Google Cloud, sigue estos pasos:
Navega a la página Transcripciones.
Haz clic en Nueva transcripción y selecciona el audio en la pestaña Configuración de audio.
En la pestaña Opciones de transcripción, selecciona V2.