Transcribe voz a texto con la consola de Google Cloud

En esta guía de inicio rápido, se presenta la consola de Cloud Speech-to-Text. En esta guía de inicio rápido, crearás y definirás mejor una transcripción y aprenderás a usar esta configuración con la API de Speech-to-Text para tus propias aplicaciones.

Para obtener información sobre cómo enviar solicitudes y recibir respuestas mediante la API de REST en lugar de la Consola, consulta la página Antes de comenzar.

Antes de comenzar

Antes de comenzar a usar la consola de Speech-to-Text, debes habilitar la API en Google Cloud Platform Console. Los siguientes pasos te guiarán a través de las siguientes acciones:

  • Habilitar Speech-to-Text en un proyecto
  • Asegúrate de que la facturación esté habilitada para Speech-to-Text.

Configura el proyecto de Google Cloud

  1. Accede a la consola de Google Cloud

  2. Ir a la página Selector de proyectos

    Puedes elegir un proyecto existente o crear uno nuevo. Si deseas obtener más detalles para crear un proyecto, consulta la documentación de Google Cloud Platform.

  3. Si creas un proyecto nuevo, se te pedirá que vincules una cuenta de facturación a este proyecto. Si usas un proyecto existente, asegúrate de que la facturación esté habilitada.

    Descubre cómo confirmar que tienes habilitada la facturación en un proyecto.

  4. Una vez que seleccionaste un proyecto y lo vinculaste a una cuenta de facturación, puedes habilitar la API de Speech-to-Text. Ve a la barra Buscar productos y recursos en la parte superior de la página y escribe “speech”.

  5. Selecciona la API de Cloud Speech-to-Text en la lista de resultados.

  6. Para probar Speech-to-Text sin vincularlo a tu proyecto, elige la opción PROBAR ESTA API. Si deseas habilitar la API de Speech-to-Text para usarla en tu proyecto, haz clic en HABILITAR.

Crea una transcripción

Usa la consola de Google Cloud para crear una transcripción nueva:

Configuración de audio

  1. Abre la descripción general de Speech-to-Text.

    Captura de pantalla de la página Descripción general de texto a voz.

  2. Haz clic en Crear transcripción.

    • Si es la primera vez que usas la consola, se te pedirá que elijas dónde almacenar las opciones de configuración y las transcripciones en Cloud Storage.
      Captura de pantalla de la página Crear transcripción de texto a voz.
  3. En la página Crear transcripción, sube un archivo de audio de origen. Puedes elegir un archivo guardado en Cloud Storage o subir uno nuevo al destino de Cloud Storage especificado.

  4. Selecciona el tipo de codificación del archivo de audio que se subió.

  5. Especifica la tasa de muestreo.

  6. Haga clic en Continuar. Se te dirigirá a Opciones de transcripción.

Opciones de transcripción

  1. Selecciona el código de idioma del audio de origen. Este es el idioma que se está reproduciendo en la grabación.

  2. Elige el modelo de transcripción que deseas usar en el archivo. La opción predeterminada está preseleccionada y, por lo general, no es necesario realizar cambios, pero hacer coincidir el modelo con el tipo de audio puede generar una mayor exactitud. Ten en cuenta que los costos del modelo varían.

    Captura de pantalla de la página Crear transcripción de texto a voz.

  3. Haga clic en Continuar. Se te dirigirá a la Adaptación del modelo.

Adaptación de modelos (opcional)

Si el audio de origen contiene palabras poco frecuentes, nombres propios o términos de propiedad, y tienes problemas con el reconocimiento, la adaptación del modelo puede ser útil.

  1. Marca Turn on model adaptation.

  2. Elige One-time adaptation resource.

  3. Agrega frases relevantes y asígnales un valor de mejora.

    Captura de pantalla de la página Crear transcripción de texto a voz.

  4. En la columna izquierda, haz clic en Enviar para crear la transcripción.

Revisa tu transcripción

Según el tamaño de tu archivo de audio, la transcripción puede tardar desde minutos hasta horas en crearse. Una vez que se haya creado la transcripción, estará lista para su revisión. Si ordenas la tabla por marca de tiempo, puedes encontrar con facilidad tus transcripciones recientes.

  1. Haz clic en el Nombre de la transcripción que quieres revisar.

    Captura de pantalla de la página Lista de transcripción de texto a voz.
  2. Compara el texto de Transcripción con el archivo de audio.

    Captura de pantalla de la página Lista de transcripción de texto a voz.
  3. Si deseas realizar cambios, haz clic en Reuse configuration. Esto te llevará al flujo Crear transcripción con las mismas opciones preseleccionadas, lo que te permitirá cambiar algunos elementos, crear una transcripción nueva y comparar los resultados.

¿Qué sigue?