Convierte voz en texto con precisión mediante una API con lo mejor de la investigación y la tecnología de IA de Google.
Los clientes nuevos obtienen $300 en créditos gratuitos para gastar en Speech‑to‑Text. Todos los clientes obtienen 60 minutos para transcribir y analizar audio gratis por mes, que no se descuentan de sus créditos.
Transcribe tu contenido con subtítulos precisos.
Habilita la potencia de la voz para crear mejores experiencias de usuario.
Mejora tu servicio con estadísticas de las interacciones de los clientes.
Comienza rápido con nuestro instructivo en la consola.
Beneficios
Aplica los algoritmos más avanzados de red neuronal de aprendizaje profundo de Google para el reconocimiento de voz automático (ASR).
Experimenta, crea y administra recursos personalizados con la IU de Speech‑to‑Text.
Implementa ASR cuando lo necesites, ya sea en la nube con la API o localmente con Speech‑to‑Text On-Prem.
Demostración
Al igual que en esta demostración, puedes incorporar fácilmente la transcripción de voz a tus aplicaciones con la API de Speech‑to‑Text.
Características clave
Proporciona sugerencias para aumentar la exactitud de la transcripción de palabras o frases inusuales o específicas del dominio. Usa clases para convertir automáticamente números hablados en direcciones, años, monedas y más.
Elige entre varios modelos entrenados y seleccionados para el control por voz y las transcripciones de video y llamadas telefónicas, con la optimización necesaria para satisfacer los requisitos de calidad específicos del dominio.
Experimenta en tu audio de voz con nuestra interfaz de usuario fácil de utilizar. Prueba diferentes parámetros de configuración para optimizar la calidad y la exactitud.
Ejecuta los algoritmos de voz de Google Cloud de forma local en cualquier dispositivo, independientemente de la conectividad a Internet. Promételes a los usuarios que sus datos de voz nunca saldrán de sus dispositivos.
Crea aplicaciones compatibles con funciones de voz para públicos globales con modelos de voz que usan la tecnología de Chirp, el modelo de voz base de Google Cloud que se entrenó con millones de horas de datos de audio y miles de millones de oraciones de texto.
Clientes