Sintetizar voz con streaming bidireccional
En este documento se explica cómo sintetizar audio mediante el streaming bidireccional.
El streaming bidireccional te permite enviar texto y recibir datos de audio simultáneamente. Esto significa que puedes empezar a sintetizar el habla antes de que se envíe el texto de entrada completo, lo que reduce la latencia y permite interacciones en tiempo real. Los asistentes de voz y los juegos interactivos usan el streaming bidireccional para crear aplicaciones más dinámicas y con mayor capacidad de respuesta.
Para obtener más información sobre los conceptos fundamentales de Text-to-Speech, consulta el artículo Conceptos básicos de Text-to-Speech.
Antes de empezar
Antes de enviar una solicitud a la API Text-to-Speech, debes haber completado las siguientes acciones. Consulta la página Antes de empezar para obtener más información.
- Habilita Text-to-Speech en un Google Cloud proyecto.
- Asegúrate de que la facturación esté habilitada en Text-to-Speech.
-
Instala Google Cloud CLI y, a continuación, inicia sesión en gcloud CLI con tu identidad federada. Después de iniciar sesión, inicializa la CLI de Google Cloud ejecutando el siguiente comando:
gcloud init
Sintetizar voz con streaming bidireccional
Instalar la biblioteca cliente
Python
Antes de instalar la biblioteca, prepara el entorno para las tareas de desarrollo en Python.
pip install --upgrade google-cloud-texttospeech
Enviar un flujo de texto y recibir un flujo de audio
La API acepta un flujo de solicitudes de tipo StreamingSynthesizeRequest
,
que contienen StreamingSynthesisInput
o StreamingSynthesizeConfig
.
Antes de enviar un flujo StreamingSynthesizeRequest
con StreamingSynthesisInput
, que proporciona entrada de texto, envía exactamente un StreamingSynthesizeRequest
con un StreamingSynthesizeConfig
.
La conversión de texto a voz en streaming solo es compatible con las voces Chirp 3 HD.
Python
Antes de ejecutar el ejemplo, prepara el entorno para las tareas de desarrollo en Python.
Limpieza
Para evitar cargos innecesarios de Google Cloud Platform, usa el Google Cloud console para eliminar tu proyecto si no lo necesitas.
Siguientes pasos
- Consulta más información sobre Cloud Text-to-Speech en la sección de conceptos básicos.
- Consulta la lista de voces disponibles que puedes usar para la síntesis de voz.