Sintetiza la voz con transmisión bidireccional
En este documento, se explica el proceso de sintetizar audio con la transmisión bidireccional.
La transmisión bidireccional te permite enviar entradas de texto y recibir datos de audio de forma simultánea. Esto significa que puedes comenzar a sintetizar la voz antes de que se envíe el texto de entrada completo, lo que reduce la latencia y habilita interacciones en tiempo real. Los asistentes de voz y los juegos interactivos usan la transmisión bidireccional para crear aplicaciones más dinámicas y responsivas.
Para obtener más información sobre los conceptos básicos de Text-to-Speech, consulta Conceptos básicos de Text-to-Speech.
Antes de comenzar
Antes de enviar una solicitud a la API de Text-to-Speech, debes completar las siguientes acciones. Consulta la página antes de comenzar para obtener más detalles.
- Habilita Text-to-Speech en un proyecto de Google Cloud .
- Asegúrate de que la facturación esté habilitada para Text-to-Speech.
-
After installing the Google Cloud CLI, configure the gcloud CLI to use your federated identity and then initialize it by running the following command:
gcloud init
Sintetiza la voz con transmisión bidireccional
Instala la biblioteca cliente
Antes de instalar la biblioteca, asegúrate de haber preparado tu entorno para el desarrollo en Python.
pip install --upgrade google-cloud-texttospeech
Envía una transmisión de texto y recibe una transmisión de audio
La API acepta un flujo de solicitudes con el tipo StreamingSynthesizeRequest
, que contiene StreamingSynthesisInput
o StreamingSynthesizeConfig
.
Antes de enviar un flujo StreamingSynthesizeRequest
con StreamingSynthesisInput
, que proporciona una entrada de texto, envía exactamente un StreamingSynthesizeRequest
con un StreamingSynthesizeConfig
.
La transmisión de texto a voz solo es compatible con las voces de Journey.
Antes de ejecutar el ejemplo, asegúrate de haber preparado tu entorno para el desarrollo en Python.
Limpia
A fin de evitar cargos innecesarios de Google Cloud Platform, usa la consola de Google Cloud para borrar tu proyecto si no lo necesitas.
¿Qué sigue?
- Obtén más información sobre Cloud Text-to-Speech en el artículo de Conceptos básicos.
- Revisa la lista de las voces disponibles que puedes usar como voz sintética.