Documentación de Speech‑to‑Text
Con Speech-to-Text, se puede realizar una integración sencilla de las tecnologías de reconocimiento de voz de Google en las aplicaciones de los desarrolladores. Envía audios y recibe una transcripción de texto del servicio de la API de Speech-to-Text. Más información
Comienza tu prueba de concepto con un crédito gratis de USD 300
- Accede a Gemini 2.0 Flash Thinking
- Uso mensual gratuito de productos populares, incluidas las APIs de IA y BigQuery
- Sin cargos automáticos y sin compromisos
Sigue explorando con más de 20 productos siempre gratuitos
Accede a más de 20 productos gratuitos para casos de uso comunes, incluidas APIs de IA, VMs, almacenes de datos y mucho más.
Recursos de documentación
Guías
-
Guía de inicio rápido: Transcribir la voz a texto con las bibliotecas cliente
-
Guía de inicio rápido: Transcribir la voz a texto con la API
-
Guía de inicio rápido: Transcribir la voz a texto con la CLI de gcloud
-
Idiomas admitidos
-
Transcribe audio de una entrada de transmisión
-
Transcribe archivos de audio largos
-
Bibliotecas cliente de Speech-to-Text
-
Transcribe archivos de audio cortos
-
Separa diferentes interlocutores en una grabación de audio
-
Videos relacionados
Prueba Speech-to-Text tú mismo
Crea una cuenta para evaluar el rendimiento de nuestros productos en situaciones reales.
Los clientes nuevos también obtienen $300 en créditos gratuitos para ejecutar, probar y, además, implementar cargas de trabajo.