En este lab, aprenderás a usar Generative AI Studio para crear instrucciones para varios casos de uso de IA generativa y experimentar con ellas.
Para aprender a convertir la voz en texto, consulta Convierte voz en texto.
Convierte voz a texto
Para convertir voz en texto, haz lo siguiente:
En la sección Vertex AI de la consola de Google Cloud, ve a la página Vertex AI Studio.
En la tarjeta Voz, haz clic en Abrir.
Selecciona la pestaña Voz a texto.
En Voz, haz clic en Explorar para seleccionar el archivo de audio que deseas convertir en texto.
En el cuadro de selección Idioma, selecciona el idioma de la voz en el archivo de audio.
Haz clic en Enviar.
El texto convertido aparece en Texto.
Limitaciones
- Los archivos de audio pueden tener un máximo de 60 segundos o 10 MB (lo que sea menor).
- Los archivos se transcriben con el modelo Chirp.
- Solo se admiten archivos WAV lineales de 16 bits.
Puedes usar la IU de Speech-to-Text directamente para superar estas limitaciones.
¿Qué sigue?
- Para obtener más modelos, funciones avanzadas y la capacidad de transcribir archivos de hasta 8 horas, consulta Speech-to-Text.