Sintetize voz com streaming bidirecional
Este documento explica o processo de síntese de áudio através da transmissão bidirecional.
O streaming bidirecional permite-lhe enviar texto introduzido e receber dados de áudio em simultâneo. Isto significa que pode começar a sintetizar a voz antes de o texto de entrada completo ser enviado, o que reduz a latência e permite interações em tempo real. Os assistentes de voz e os jogos interativos usam o streaming bidirecional para criar aplicações mais dinâmicas e responsivas.
Para saber mais acerca dos conceitos fundamentais da conversão de texto em voz, leia o artigo Noções básicas da conversão de texto em voz.
Antes de começar
Antes de poder enviar um pedido para a API Text-to-Speech, tem de ter concluído as seguintes ações. Consulte a página antes de começar para ver detalhes.
- Ative a conversão de texto em voz num Google Cloud projeto.
- Certifique-se de que a faturação está ativada para a conversão de texto em voz.
-
Instale a CLI Google Cloud e, em seguida, inicie sessão na CLI gcloud com a sua identidade federada. Depois de iniciar sessão, inicialize a CLI gcloud executando o seguinte comando:
gcloud init
Sintetize voz com streaming bidirecional
Instale a biblioteca de cliente
Python
Antes de instalar a biblioteca, certifique-se de que preparou o seu ambiente para o desenvolvimento em Python.
pip install --upgrade google-cloud-texttospeech
Envie uma stream de texto e receba uma stream de áudio
A API aceita um fluxo de pedidos do tipo StreamingSynthesizeRequest
, que contêm StreamingSynthesisInput
ou StreamingSynthesizeConfig
.
Antes de enviar uma stream StreamingSynthesizeRequest
com StreamingSynthesisInput
, que fornece entrada de texto, envie exatamente um StreamingSynthesizeRequest
com um StreamingSynthesizeConfig
.
A conversão de texto em voz de streaming só é compatível com o Chirp 3: vozes em HD.
Python
Antes de executar o exemplo, certifique-se de que preparou o seu ambiente para o desenvolvimento em Python.
Limpar
Para evitar cobranças desnecessárias da Google Cloud Platform, use o Google Cloud console para eliminar o seu projeto se não precisar dele.
O que se segue?
- Saiba mais sobre o Cloud Text-to-Speech lendo as noções básicas.
- Reveja a lista de vozes disponíveis que pode usar para a voz sintética.