Organízate con las colecciones
Guarda y clasifica el contenido según tus preferencias.
Esta es la referencia de la API gRPC de Speech-to-Text. Es una de las APIs preentrenadas de Vertex AI disponibles en el dispositivo con espacio de aire de Google Distributed Cloud (GDC).
Usa esta guía para integrar mediante programación las tecnologías de reconocimiento de voz en las aplicaciones de desarrolladores. Envía audio y recibe una transcripción de texto del servicio de la API Speech-to-Text de Vertex AI. Por ejemplo, si envías audio en español, el resultado será una transcripción de texto en español.
Métodos de Speech-to-Text
Hay dos métodos disponibles en GDC:
Recognize: realiza el reconocimiento de voz síncrono. Recognize recibe los resultados una vez que se ha enviado y procesado todo el audio.
StreamingRecognize realiza el reconocimiento de voz bidireccional en streaming. StreamingRecognize recibe resultados mientras envía audio.
[[["Es fácil de entender","easyToUnderstand","thumb-up"],["Me ofreció una solución al problema","solvedMyProblem","thumb-up"],["Otro","otherUp","thumb-up"]],[["Es difícil de entender","hardToUnderstand","thumb-down"],["La información o el código de muestra no son correctos","incorrectInformationOrSampleCode","thumb-down"],["Me faltan las muestras o la información que necesito","missingTheInformationSamplesINeed","thumb-down"],["Problema de traducción","translationIssue","thumb-down"],["Otro","otherDown","thumb-down"]],["Última actualización: 2025-09-12 (UTC)."],[],[],null,[]]