En esta guía de inicio rápido, encontrarás una introducción a Text-to-Speech. Aquí, configurarás tu proyecto y autorización de Google Cloud Platform y, luego, realizarás una solicitud de Text-to-Speech para crear audio a partir de texto.
Para obtener más información sobre los conceptos básicos de Text-to-Speech, consulta los Conceptos básicos de la API de Text-to-Speech.
Antes de comenzar
- Accede a tu Cuenta de Google.
Si todavía no tienes una cuenta, regístrate para obtener una nueva.
-
En la página del selector de proyectos de Google Cloud Console, selecciona o crea un proyecto de Google Cloud.
-
Asegúrate de que la facturación esté habilitada para tu proyecto de Cloud. Descubre cómo confirmar que tienes habilitada la facturación en un proyecto.
- Habilita la API Cloud Text-to-Speech.
- Configura la autenticación
-
En Cloud Console, ve a la página Crea una clave de cuenta de servicio.
Ir a la página Crea una clave de la cuenta de servicio - En la lista Cuenta de servicio, selecciona Cuenta de servicio nueva.
- Ingresa un nombre en el campo Nombre de cuenta de servicio.
- No selecciones un valor de la lista Función. No se necesita una función para acceder a este servicio.
- Haz clic en Crear. Aparece una nota que advierte que esta cuenta de servicio no tiene función.
- Haz clic en Crear sin función. En tu computadora, se descargará un archivo JSON que contiene las claves.
-
-
Configura la variable de entorno
GOOGLE_APPLICATION_CREDENTIALS
en la ruta del archivo JSON que contiene la clave de tu cuenta de servicio. Esta variable solo se aplica a la sesión actual de shell. Por lo tanto, si abres una sesión nueva, deberás volver a configurar la variable. - Instala e inicializa el SDK de Cloud.
Sintetiza audio a partir de texto
Para convertir texto en audio, realiza una solicitud HTTP POST al extremo https://texttospeech.googleapis.com/v1/text:synthesize
. En el cuerpo del comando POST, especifica el tipo de voz que se debe sintetizar en la sección de configuración de voice
, especifica el texto que se debe sintetizar en el campo text
de la sección input
y especifica el tipo de audio que se creará en la sección audioConfig
.
Ejecuta la solicitud REST que aparece a continuación en la línea de comandos para sintetizar audio a partir de texto mediante Text-to-Speech. La operación usa el comando
gcloud auth application-default print-access-token
a fin de recuperar un token de autorización para la solicitud.Método HTTP y URL:
POST https://texttospeech.googleapis.com/v1/text:synthesize
Cuerpo JSON de la solicitud:
{ "input":{ "text":"Android is a mobile operating system developed by Google, based on the Linux kernel and designed primarily for touchscreen mobile devices such as smartphones and tablets." }, "voice":{ "languageCode":"en-gb", "name":"en-GB-Standard-A", "ssmlGender":"FEMALE" }, "audioConfig":{ "audioEncoding":"MP3" } }
Para enviar tu solicitud, expande una de estas opciones:
Deberías recibir una respuesta JSON similar a la que se muestra a continuación:
{ "audioContent": "//NExAASCCIIAAhEAGAAEMW4kAYPnwwIKw/BBTpwTvB+IAxIfghUfW.." }
El resultado de JSON para el comando de REST contiene audio sintetizado en un formato con codificación Base64. Copia el contenido del campo
audioContent
en un archivo nuevo llamadosynthesize-output-base64.txt
. Tu archivo nuevo debería ser similar al siguiente ejemplo://NExAARqoIIAAhEuWAAAGNmBGMY4EBcxvABAXBPmPIAF//yAuh9Tn5CEap3/o ... VVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVV
Decodifica el contenido del archivo
synthesize-output-base64.txt
en un archivo nuevo llamadosynthesized-audio.mp3
. Para obtener más información sobre la decodificación de Base64, consulta Cómo decodificar contenido de audio codificado en Base64.base64 synthesize-output-base64.txt --decode > synthesized-audio.mp3
Reproduce el contenido de
synthesized-audio.mp3
en una aplicación de audio o en un dispositivo de audio. También puedes abrir elsynthesized-audio.mp3
en el navegador Chrome para reproducir el audio con solo navegar a la carpeta que contiene el archivo, por ejemplofile://my_file_path/synthesized-audio.mp3
.
Limpia
A fin de evitar cargos innecesarios de Google Cloud Platform, usa Cloud Console para borrar tu proyecto si no lo necesitas.
¿Qué sigue?
- Obtén más información sobre Cloud Text-to-Speech en el artículo de Conceptos básicos.
- Revisa la lista de las voces disponibles que puedes usar como voz sintética.