Antes de comenzar

Text-to-Speech es una API impulsada por la tecnología de inteligencia artificial (IA) de Google. Envías los datos de transcripción a Text-to-Speech en una llamada a la API y, luego, recibes voz humana sintética y con sonido natural como audio reproducible en respuesta. Para obtener más información sobre el funcionamiento de Text-to-Speech, consulta la página Conceptos básicos.

Te proporcionamos muestras de código que te muestran cómo realizar una solicitud a la API y recibir una respuesta. Puedes aprender a usar estas muestras con las guías de inicio rápido de texto a voz y las guías prácticas.

En esta guía, se explican los pasos necesarios para comenzar a enviar solicitudes a la API de Text-to-Speech.

Descripción general

Antes de que puedas comenzar a usar Text-to-Speech, debes habilitar la API en Google Cloud Platform Console. Los siguientes pasos te guiarán a través de las siguientes acciones:

  • Habilita Text-to-Speech en un proyecto.
    1. Asegúrate de que la facturación esté habilitada para Text-to-Speech.
    2. Asegúrate de que tu proyecto tenga al menos una cuenta de servicio.
    3. Descarga una clave de credencial de la cuenta de servicio.
  • Establece tu variable de entorno de autenticación.

Configura el proyecto de Google Cloud Platform

  1. Acceder a Cloud Console

  2. Ir a la página Selector de proyectos

    Puedes elegir un proyecto existente o crear uno nuevo. Para obtener más detalles sobre cómo crear un proyecto, consulta la documentación de Google Cloud Platform.

  3. Si creas un proyecto nuevo, se te pedirá que vincules una cuenta de facturación a este proyecto. Si usas un proyecto existente, asegúrate de que la facturación esté habilitada.

    Descubre cómo confirmar que tienes habilitada la facturación en un proyecto.

  4. Una vez que seleccionaste un proyecto y lo vinculaste a una cuenta de facturación, puedes habilitar la API de Text-to-Speech. Ve a la barra Buscar productos y recursos en la parte superior de la página y escribe “speech”. Selecciona la API de Cloud Text-to-Speech en la lista de resultados.

  5. Para probar Text-to-Speech sin vincularlo a tu proyecto, elige la opción PROBAR ESTA API. Para habilitar la API de Text-to-Speech a fin de usarla con tu proyecto, haz clic en HABILITAR.

  6. Ahora debes vincular una o más cuentas de servicio a la API de Text-to-Speech. Haz clic en el vínculo Credenciales a la izquierda de la página de la API de Text-to-Speech:

    Si no tienes ninguna cuenta de servicio asociada a este proyecto, sigue las instrucciones en la sección Crea una nueva cuenta de servicio.

    Si tienes cuentas de servicio creadas con anterioridad asociadas a este proyecto, aparecerán en esta página. Asegúrate de tener acceso a una clave JSON descargada asociada con la cuenta de servicio que deseas usar en la autenticación con Text-to-Speech. Las claves de las cuentas de servicio se pueden descargar solo una vez, en el momento en que se crean. Si tu cuenta de servicio ya tiene una clave, pero no puedes ubicar el archivo .json descargado, deberás crear una nueva clave para esa cuenta de servicio y descargar su archivo .json. A fin de obtener instrucciones para crear una clave nueva en una cuenta de servicio existente, sigue las instrucciones en la sección Crea una clave JSON.

    Si ya tienes una cuenta de servicio y su clave JSON, ahora puedes configurar la variable de entorno de autenticación.

Crea una cuenta de servicio nueva

  1. Crea una cuenta de servicio nueva si tu proyecto aún no tiene una. Debes crear una cuenta de servicio para usar Text-to-Speech.

    Ir a Crear cuenta de servicio

    En el cuadro Nombre de cuenta de servicio, escribe un nombre único para la cuenta de servicio nueva. La entrada se propaga automáticamente en el cuadro ID de cuenta de servicio. El cuadro Descripción de la cuenta de servicio es opcional, pero se recomienda si planeas asociar varias cuentas de servicio a tu proyecto. Ingresa una descripción breve de la cuenta de servicio en este cuadro y, luego, haz clic en CREAR Y CONTINUAR.

  2. Te recomendamos que asignes una de las funciones de IAM básicas a tu cuenta de servicio. También puedes asignar varias funciones a una sola cuenta de servicio si es necesario. Si deseas obtener detalles sobre las funciones disponibles y los permisos permitidos para cada una, consulta las funciones de IAM. Haz clic en el menú desplegable Selecciona una función y desplázate hasta Básica. Puedes elegir una función para esta cuenta de servicio de las opciones que aparecen en la columna de la derecha. Haz clic en CONTINUAR.

  3. El paso final te permite habilitar de forma opcional que otras entidades (personas, grupos de Google, etc.) accedan a tu cuenta de servicio. Si no necesitas otorgar acceso adicional, puedes hacer clic en LISTO sin ingresar ninguna información.

  4. La cuenta de servicio ahora aparece en la página Cuentas de servicio. Puedes cambiar los permisos de la cuenta de servicio, agregar o generar claves nuevas y otorgar acceso en cualquier momento.

Crea una clave JSON para tu cuenta de servicio

  1. La cuenta de servicio recién creada aparecerá en la página de cuentas de servicio. Crea una clave privada que se asociará a esa cuenta. Debes usar esta clave privada durante el proceso de autenticación cuando envías una solicitud a Text-to-Speech. Si decides no crear una clave ahora, puedes generar una clave o cambiar la información de usuario individual en cualquier momento si accedes a la cuenta de servicio a través de IAM y administración -> Cuentas de servicio en el menú de navegación principal.

    Para crear una clave, haz clic en la cuenta de servicio y selecciona CLAVES. Haz clic en ADD KEY -> Create new key. Te recomendamos que crees una clave en formato JSON.

  2. Se descarga automáticamente una clave nueva en el formato que elijas. Almacena este archivo en una ubicación segura y toma nota de la ruta de acceso. Deberás apuntar la variable de entorno GOOGLE_APPLICATION_CREDENTIALS a este archivo cuando pases por el proceso de autenticación al principio de cada sesión nueva de Text-to-Speech. , Este es un paso esencial para autenticar solicitudes a Text-to-Speech. El ID único de la clave aparece junto al nombre de la cuenta de servicio.

Establece tu variable de entorno de autenticación.

Para configurar la GOOGLE_APPLICATION_CREDENTIALS, debes tener una cuenta de servicio asociada con tu proyecto y tener acceso a la clave JSON de la cuenta de servicio.

Configura la variable de entorno GOOGLE_APPLICATION_CREDENTIALS para proporcionar credenciales de autenticación al código de la aplicación. Esta variable se aplica solo a tu sesión de shell actual. Si quieres que la variable se aplique a sesiones de shell futuras, configura la variable en tu archivo de inicio de shell, por ejemplo, en el archivo ~/.bashrc o ~/.profile.

Linux o macOS

export GOOGLE_APPLICATION_CREDENTIALS="KEY_PATH"

Reemplaza KEY_PATH por la ruta de acceso del archivo JSON que contiene la clave de tu cuenta de servicio.

Por ejemplo:

export GOOGLE_APPLICATION_CREDENTIALS="/home/user/Downloads/service-account-file.json"

Windows

Para PowerShell:

$env:GOOGLE_APPLICATION_CREDENTIALS="KEY_PATH"

Reemplaza KEY_PATH por la ruta de acceso del archivo JSON que contiene la clave de tu cuenta de servicio.

Por ejemplo:

$env:GOOGLE_APPLICATION_CREDENTIALS="C:\Users\username\Downloads\service-account-file.json"

Para el símbolo del sistema:

set GOOGLE_APPLICATION_CREDENTIALS=KEY_PATH

Reemplaza KEY_PATH por la ruta de acceso del archivo JSON que contiene la clave de tu cuenta de servicio.

Para obtener más información, consulta la documentación sobre la autenticación de Google Cloud Platform.

Inhabilita la API de Text-to-Speech

Para inhabilitar la API de Text-to-Speech, navega al panel de Google Cloud Platform y haz clic en el vínculo Ir a la descripción general de las API en el cuadro API. Haz clic en la API de Text-to-Speech y, luego, selecciona el botón INHABILITAR API en la parte superior de la página.

¿Qué sigue?

Obtén información sobre cómo enviar una solicitud de transcripción a la API de Text-to-Speech mediante bibliotecas cliente o la línea de comandos.