Guía de inicio rápido: Usa la herramienta de gcloud

En esta página, se muestra cómo enviar una solicitud de reconocimiento de voz a Speech-to-Text con la herramienta de gcloud desde la línea de comandos.

Con Speech-to-Text, se puede realizar una integración sencilla de las tecnologías de reconocimiento de voz de Google en las aplicaciones de los desarrolladores. Puedes enviar datos de audio a la API de Speech-to-Text que, a su vez, muestra una transcripción de texto de ese archivo de audio. Para obtener más información sobre el servicio, consulta Conceptos básicos de Speech-to-Text.

Antes de comenzar

Antes de enviar una solicitud a la API de Speech-to-Text, debes completar las siguientes acciones. Consulta la página antes de comenzar para obtener más detalles.

  • Habilitar Speech-to-Text en un proyecto de GCP
    1. Asegúrate de que la facturación esté habilitada para Speech-to-Text.
    2. Crea o asigna una o más cuentas de servicio a Speech-to-Text.
    3. Descarga una clave de credencial de la cuenta de servicio.
  • Establece tu variable de entorno de autenticación.
  • Crea un bucket de Google Cloud Storage nuevo para almacenar tus datos de audio (opcional).

Realiza una solicitud de transcripción de audio

Ahora puedes usar Speech-to-Text para transcribir un archivo de audio a texto. Usa la siguiente muestra de código para enviar una solicitud de recognize a la API de Speech-to-Text.

Abre el shell de línea de comandos y ejecuta el siguiente comando.

gcloud ml speech recognize gs://cloud-samples-tests/speech/brooklyn.flac \
    --language-code=en-US

Con este comando, se envía una solicitud para que se transcriba el audio de un FLAC alojado en una ubicación de acceso público mediante Speech-to-Text.

Si la solicitud es exitosa, el servidor muestra una respuesta en formato JSON:

{
  "results": [
    {
      "alternatives": [
        {
          "confidence": 0.9840146,
          "transcript": "how old is the Brooklyn Bridge"
        }
      ]
    }
  ]
}

Felicitaciones Enviaste tu primera solicitud a Speech-to-Text.

Si recibes un error o una respuesta vacía de Speech-to-Text, consulta los pasos de Solución de problemas y Mensajes de error.

¿Qué sigue?