Guía de inicio rápido: usa la IU de Speech-to-Text

En esta guía de inicio rápido, se presenta la consola de Cloud Speech-to-Text. En esta guía de inicio rápido, se usará Google Cloud Console a fin de configurar tu proyecto y autorización de Google Cloud, crear y definir mejor una transcripción, y aprender a usar esta configuración con Speech-to-Text. API para tus propias aplicaciones.

Con Speech-to-Text, se puede realizar una integración sencilla de las tecnologías de reconocimiento de voz de Google en las aplicaciones de los desarrolladores. Puedes enviar datos de audio a la API de Speech-to-Text que, a su vez, muestra una transcripción de texto de ese archivo de audio. Para obtener más información sobre el servicio, consulta Conceptos básicos de Speech-to-Text.

Antes de comenzar

  1. Accede a tu cuenta de Google Cloud. Si eres nuevo en Google Cloud, crea una cuenta para evaluar el rendimiento de nuestros productos en situaciones reales. Los clientes nuevos también obtienen $300 en créditos gratuitos para ejecutar, probar y, además, implementar cargas de trabajo.
  2. Configura un proyecto de Cloud Console.

    Configurar un proyecto

    Haz clic para realizar alguna de las siguientes acciones:

    • Crea o selecciona un proyecto.
    • Habilita la API de Speech-to-Text para ese proyecto.
    • Crea una cuenta de servicio.
    • Descargar una clave privada como JSON

    Puedes ver y administrar estos recursos en cualquier momento desde Cloud Console.

  3. En Google Cloud Console, en la página de selección de proyecto, selecciona o crea un proyecto de Google Cloud.

    Nota: Si no planeas conservar los recursos creados durante este procedimiento, crea un proyecto en lugar de seleccionar un proyecto existente. Cuando termines, puedes borrar el proyecto y quitar todos los recursos asociados con él.

  4. En Google Cloud Console, ve a la página del selector de proyectos.

    Ir al selector de proyecto

  5. Selecciona o crea un proyecto de Google Cloud.

  6. Asegúrate de que la facturación esté habilitada para tu proyecto de Cloud.
  7. Ve a Speech-to-Text en Google Cloud Console. Se te solicitará que habilites la API de Google Cloud Speech-to-Text si todavía no lo hiciste.

Crear una transcripción

Usa Google Cloud Console para crear una transcripción nueva:

Configuración de audio

  1. Abre la descripción general de Speech-to-Text.

  2. Haz clic en Crear transcripción.

    • Si es la primera vez que usas la consola, se te pedirá que elijas dónde deseas que se almacenen en Cloud Storage la configuración y las transcripciones.
  3. En la página Crear transcripción, Sube un archivo de audio de origen. Puedes elegir un archivo que ya esté guardado en Cloud Storage o subir uno nuevo al destino de Cloud Storage especificado.

  4. Selecciona el tipo de codificación del archivo de audio subido.

  5. Especifique su tasa de muestreo.

  6. Haga clic en Continuar. Se te dirigirá a Opciones de transcripción.

Opciones de transcripción

  1. Selecciona el código de idioma del audio de origen. Este es el idioma que se habla en la grabación.

  2. Elige el modelo de transcripción que quieras usar en el archivo. La opción predeterminada está preseleccionada y, por lo general, no se requiere ningún cambio, pero hacer coincidir el modelo con el tipo de audio puede dar como resultado una mayor precisión. Ten en cuenta que los costos del modelo varían.

  3. Haga clic en Continuar. Se lo redireccionará a Adaptación de modelos.

Adaptación del modelo (opcional)

Si el audio de origen contiene palabras poco comunes, nombres propios o términos propios, y experimentas problemas con el reconocimiento, la adaptación del modelo puede ayudar.

  1. Marca Activar la adaptación de modelo.

  2. Selecciona Recurso único de adaptación.

  3. Agregue frases relevantes y proporciónale un valor de mejora.

  4. En la columna de la izquierda, haz clic en Enviar para crear la transcripción.

Revisa tu transcripción

Según el tamaño de tu archivo de audio, la transcripción puede tardar entre minutos y horas. Una vez que se creó tu transcripción, estará lista para su revisión. Ordenar la tabla por marca de tiempo puede ayudarte a encontrar con facilidad tus transcripciones recientes.

  1. Haz clic en el Nombre de la transcripción que quieres revisar.

  2. Comparar el texto de Transcripción con el archivo de audio

  3. Si quieres hacer cambios, haz clic en Reusar la configuración. Esto te llevará al flujo Crear transcripción con las mismas opciones preseleccionadas, lo que te permite cambiar algunas cosas, crear una transcripción nueva y comparar los resultados.