Convertir voz en texto

En esta página se explica cómo usar Vertex AI Studio para convertir voz en texto.

Para saber cómo convertir texto en voz, consulta el artículo Convertir texto en voz.

Convertir voz en texto

Para convertir la voz en texto, sigue estos pasos:

  1. En la sección Vertex AI de la Google Cloud consola, ve a la página Vertex AI Studio.

    Ir a Vertex AI Studio

  2. Haz clic en Generar voz.

  3. Selecciona la pestaña Transcripción de voz.

  4. En Voz, haz clic en Buscar para seleccionar el archivo de audio que quieras convertir en texto.

  5. En el cuadro del selector Idioma, selecciona el idioma del discurso del archivo de audio.

  6. Haz clic en Enviar.

    El texto convertido aparece en Texto.

Limitaciones

  • Los archivos de audio pueden tener una duración máxima de 60 segundos o un tamaño máximo de 10 MB (lo que ocupe menos).
  • Los archivos se transcriben con el modelo Chirp.
  • Solo se admiten archivos WAV PCM lineales de 16 bits.

Puedes usar la interfaz de usuario de Speech-to-Text directamente para superar estas limitaciones.

Siguientes pasos

  • Para obtener más modelos, funciones avanzadas y la posibilidad de transcribir archivos de hasta 8 horas, consulta Transcripción de voz.