Aprende a compilar la nueva generación de aplicaciones de IA. Únete a la Cumbre de IA aplicada el 13 de diciembre. 
Ir a
Speech‑to‑Text

Speech‑to‑Text

Convierte voz en texto con precisión mediante una API con lo mejor de la investigación y la tecnología de IA de Google.

Los clientes nuevos obtienen $300 en créditos gratuitos para gastar en Speech‑to‑Text. Todos los clientes obtienen 60 minutos para transcribir y analizar audio gratis por mes, que no se descuentan de sus créditos.

  • Transcribe tu contenido con subtítulos precisos.

  • Habilita la potencia de la voz para crear mejores experiencias de usuario.

  • Mejora tu servicio con estadísticas de las interacciones de los clientes.

  • Comienza rápido con nuestro instructivo en la consola.

Beneficios

Precisión de vanguardia

Aplica los algoritmos más avanzados de red neuronal de aprendizaje profundo de Google para el reconocimiento de voz automático (ASR).

Personalización sencilla de modelos

Experimenta, crea y administra recursos personalizados con la IU de Speech‑to‑Text.

Implementación de modelos flexible

Implementa ASR cuando lo necesites, ya sea en la nube con la API o localmente con Speech‑to‑Text On-Prem.

Demostración

Usa Speech‑to‑Text

Al igual que en esta demostración, puedes incorporar fácilmente la transcripción de voz a tus aplicaciones con la API de Speech‑to‑Text.

Características clave

Características clave

Adaptación de voz

Proporciona sugerencias para aumentar la exactitud de la transcripción de palabras o frases inusuales o específicas del dominio. Usa clases para convertir automáticamente números hablados en direcciones, años, monedas y más.

Modelos específicos del dominio

Elige entre varios modelos entrenados y seleccionados para el control por voz y las transcripciones de video y llamadas telefónicas, con la optimización necesaria para satisfacer los requisitos de calidad específicos del dominio. 

Comparaciones de calidad fáciles de obtener

Experimenta en tu audio de voz con nuestra interfaz de usuario fácil de utilizar. Prueba diferentes parámetros de configuración para optimizar la calidad y la exactitud.

Voz integrada en el dispositivo

Ejecuta los algoritmos de voz de Google Cloud de forma local en cualquier dispositivo, independientemente de la conectividad a Internet. Promételes a los usuarios que sus datos de voz nunca saldrán de sus dispositivos.

Modelo de base para Speech-to-Text

Crea aplicaciones compatibles con funciones de voz para públicos globales con modelos de voz que usan la tecnología de Chirp, el modelo de voz base de Google Cloud que se entrenó con millones de horas de datos de audio y miles de millones de oraciones de texto. 

Ver todas las características

Clientes

Aprende de los cl