La versión 2 de la API Speech-to-Text ofrece a los clientes el diseño de API más reciente para cumplir los requisitos normativos y de seguridad de las empresas desde el primer momento. Google Cloud
Estos requisitos se cumplen de las siguientes formas:
Residencia de datos: Speech-to-Text v2 ofrece la amplia gama de nuestros modelos de transcripción en Google Cloud regiones, como Bélgica o Singapur. De esta forma, se pueden invocar nuestros modelos de transcripción a través de un servicio totalmente regionalizado.
Recursos de reconocedor: los reconocedores son configuraciones de reconocimiento reutilizables que pueden contener una combinación de modelo, idioma y funciones.
Registro: la creación de recursos y las transcripciones generan registros disponibles en la Google Cloud consola, lo que permite mejorar la telemetría y la depuración.
Cifrado: Speech-to-Text v2 admite claves de cifrado gestionadas por el cliente para todos los recursos, así como la transcripción en lotes.
Detección automática de audio: Speech-to-Text v2 puede detectar automáticamente la frecuencia de muestreo, el número de canales y el formato de tus archivos de audio sin necesidad de proporcionar esa información en la configuración de la solicitud.
Migrar de v1 a v2
La migración de la API v1 a la API v2 no se realiza automáticamente. Para aprovechar el conjunto de funciones, solo es necesario hacer cambios mínimos en la implementación.
Migrar en la API
Al igual que en Speech-to-Text v1, para transcribir audio, debes crear un RecognitionConfig
. Para ello, selecciona el idioma del audio y el modelo de reconocimiento que quieras:
Python
Si es necesario, selecciona una región en la que quieras usar la API Speech-to-Text y consulta la disponibilidad de idiomas y modelos en esa región:
Python
También puedes crear un recurso de reconocedor si necesitas reutilizar una configuración de reconocimiento específica en muchas solicitudes de transcripción:
Python
Hay otras diferencias en las solicitudes y respuestas de la nueva API v2. Consulta más información en la documentación de referencia.
Migrar en la interfaz de usuario
Para migrar a través de la consola de Speech, Google Cloud sigue estos pasos:
Ve a la consola de Google Cloud Speech.
Vaya a la página Transcripciones.
Haz clic en Nueva transcripción y selecciona el audio en la pestaña Configuración de audio.
En la pestaña Opciones de transcripción, selecciona V2.
Siguientes pasos
- Usa bibliotecas de cliente para transcribir audio con tu lenguaje de programación favorito.
- Practica transcribiendo archivos de audio cortos.
- Consulta cómo transcribir audio de streaming.
- Consulta cómo transcribir archivos de audio largos.