Sintetiza la voz con transmisión bidireccional
En este documento, se explica el proceso de sintetizar audio con la transmisión bidireccional.
La transmisión bidireccional te permite enviar entradas de texto y recibir datos de audio de forma simultánea. Esto significa que puedes comenzar a sintetizar la voz antes de que se envíe el texto de entrada completo, lo que reduce la latencia y habilita interacciones en tiempo real. Los asistentes de voz y los juegos interactivos usan la transmisión bidireccional para crear aplicaciones más dinámicas y responsivas.
Para obtener más información sobre los conceptos básicos de Text-to-Speech, consulta Conceptos básicos de Text-to-Speech.
Antes de comenzar
Antes de enviar una solicitud a la API de Text-to-Speech, debes completar las siguientes acciones. Consulta la página antes de comenzar para obtener más detalles.
- Habilita Text-to-Speech en un proyecto de Google Cloud.
- Asegúrate de que la facturación esté habilitada para Text-to-Speech.
-
After installing the Google Cloud CLI, configure the gcloud CLI to use your federated identity and then initialize it by running the following command:
gcloud init
Sintetiza la voz con transmisión bidireccional
Instala la biblioteca cliente
Python
Antes de instalar la biblioteca, asegúrate de haber preparado tu entorno para el desarrollo en Python.
pip install --upgrade google-cloud-texttospeech
Envía una transmisión de texto y recibe una transmisión de audio
La API acepta un flujo de solicitudes con el tipo StreamingSynthesizeRequest
, que contiene StreamingSynthesisInput
o StreamingSynthesizeConfig
.
Antes de enviar un flujo StreamingSynthesizeRequest
con StreamingSynthesisInput
, que proporciona una entrada de texto, envía exactamente un StreamingSynthesizeRequest
con un StreamingSynthesizeConfig
.
La transmisión de texto a voz solo es compatible con las voces de Journey.
Python
Antes de ejecutar el ejemplo, asegúrate de haber preparado tu entorno para el desarrollo en Python.
Realiza una limpieza
A fin de evitar cargos innecesarios de Google Cloud Platform, usa la consola de Google Cloud para borrar tu proyecto si no lo necesitas.
¿Qué sigue?
- Obtén más información sobre Cloud Text-to-Speech en el artículo de Conceptos básicos.
- Revisa la lista de las voces disponibles que puedes usar como voz sintética.