Guía de inicio rápido: Cómo usar la línea de comandos

En esta guía de inicio rápido, se brinda una introducción a la API de Cloud Text-to-Speech. Aquí, configurarás tu proyecto y autorización de Google Cloud Platform y, luego, realizarás una solicitud a la API de Text-to-Speech para crear audio a partir de un texto.

Para obtener más información sobre los aspectos fundamentales de la API de Cloud Text-to-Speech, consulta Conceptos básicos de la API de Cloud Text-to-Speech.

Antes de comenzar

  1. Accede a tu Cuenta de Google.

    Si todavía no tienes una cuenta, regístrate para obtener una nueva.

  2. En GCP Console, en la página de selección de proyecto, selecciona o crea un proyecto de GCP.

    Ir a la página de selección de proyecto

  3. Asegúrate de tener habilitada la facturación para tu proyecto de Google Cloud Platform. Obtén información sobre cómo confirmar que tienes habilitada la facturación para tu proyecto.

  4. Habilita lasCloud Text-to-SpeechAPI.

    Habilita lasAPI

  5. Configurar la autenticación
    1. En GCP Console, ve a la página Crear clave de la cuenta de servicio.

      Ir a la página Crear clave de la cuenta de servicio
    2. En la lista Cuenta de servicio, selecciona Cuenta de servicio nueva.
    3. Ingresa un nombre en el campo Nombre de cuenta de servicio.
    4. No selecciones un valor de la lista Función. No se necesita una función para acceder a este servicio.
    5. Haz clic en Crear. Aparece una nota que advierte que esta cuenta de servicio no tiene función.
    6. Haz clic en Crear sin función. Se descargará un archivo JSON a tu computadora que contiene tus descargas de claves.
  6. Configura la variable de entorno GOOGLE_APPLICATION_CREDENTIALS con la ruta de acceso al archivo JSON que contiene la clave de tu cuenta de servicio. Esta variable solo se aplica a tu sesión actual de shell. Por lo tanto, si abres una sesión nueva, deberás volver a configurar la variable.

  7. Instala e inicializa el SDK de Cloud.

Sintetiza audio a partir de texto

Para convertir texto en audio, realiza una solicitud HTTP POST al extremo https://texttospeech.googleapis.com/v1/text:synthesize. En el cuerpo de tu comando POST, especifica el tipo de voz que deseas sintetizar en la sección de configuración de voice, el texto que deseas sintetizar en el campo text de la sección input y el tipo de audio que deseas crear en la sección audioConfig.

  1. Ejecuta la línea que se muestra a continuación en la línea de comandos para sintetizar audio a partir de un texto con la API de Text-to-Speech. Se usa el comando gcloud auth application-default print-access-token para recuperar un token de autorización para la solicitud.

    La respuesta se dirige al archivo de resultados synthesize-output.txt.

    curl -H "Authorization: Bearer "$(gcloud auth application-default print-access-token) \
      -H "Content-Type: application/json; charset=utf-8" \
      --data "{
        'input':{
          'text':'Android is a mobile operating system developed by Google,
             based on the Linux kernel and designed primarily for
             touchscreen mobile devices such as smartphones and tablets.'
        },
        'voice':{
          'languageCode':'en-gb',
          'name':'en-GB-Standard-A',
          'ssmlGender':'FEMALE'
        },
        'audioConfig':{
          'audioEncoding':'MP3'
        }
      }" "https://texttospeech.googleapis.com/v1/text:synthesize" > synthesize-text.txt
    

    El contenido del archivo synthesize-text.txt debería ser similar al siguiente ejemplo:

    {
      "audioContent": "//NExAASCCIIAAhEAGAAEMW4kAYPnwwIKw/BBTpwTvB+IAxIfghUfW.."
    }
    
    
  2. El resultado de JSON para el comando de REST contiene audio sintetizado en un formato con codificación Base64. Copia el contenido del campo audioContent en un archivo nuevo con el nombre synthesize-output-base64.txt. Tu archivo nuevo debería ser similar al siguiente ejemplo:

    //NExAARqoIIAAhEuWAAAGNmBGMY4EBcxvABAXBPmPIAF//yAuh9Tn5CEap3/o
    ...
    VVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVV
    
  3. Decodifica el contenido del archivo synthesize-output-base64.txt en un archivo nuevo llamado synthesized-audio.mp3. Para obtener más información sobre la decodificación de Base64, consulta Cómo decodificar contenido de audio codificado en Base64.

    base64 synthesize-output-base64.txt --decode > synthesized-audio.mp3
    
  4. Reproduce el contenido de synthesized-audio.mp3 en una aplicación o dispositivo de audio. También puedes abrir el archivo synthesized-audio.mp3 en el navegador Chrome para reproducir el audio. Para ello, navega a la carpeta que contiene el archivo, por ejemplo, file://my_file_path/synthesized-audio.mp3

Limpieza

A fin de evitar cargos innecesarios en Google Cloud Platform, usa GCP Console para borrar tu proyecto si no lo necesitas.

Próximos pasos

¿Te sirvió esta página? Envíanos tu opinión:

Enviar comentarios sobre…

API de Cloud Text-to-Speech
¿Necesitas ayuda? Visita nuestra página de asistencia.