Sintetize voz com streaming bidirecional
Este documento explica o processo de síntese de áudio através da transmissão bidirecional.
O streaming bidirecional permite-lhe enviar texto introduzido e receber dados de áudio em simultâneo. Isto significa que pode começar a sintetizar a voz antes de o texto de entrada completo ser enviado, o que reduz a latência e permite interações em tempo real. Os assistentes de voz e os jogos interativos usam o streaming bidirecional para criar aplicações mais dinâmicas e responsivas.
Para saber mais acerca dos conceitos fundamentais da conversão de texto em voz, leia o artigo Noções básicas da conversão de texto em voz.
Antes de começar
Antes de poder enviar um pedido para a API Text-to-Speech, tem de ter concluído as seguintes ações. Consulte a página antes de começar para ver detalhes.
- Ative a conversão de texto em voz num Google Cloud projeto.
- Certifique-se de que a faturação está ativada para a conversão de texto em voz.
-
Instale a CLI Google Cloud. Após a instalação, inicialize a CLI gcloud executando o seguinte comando:
gcloud initSe estiver a usar um fornecedor de identidade (IdP) externo, primeiro tem de iniciar sessão na CLI gcloud com a sua identidade federada.
Sintetize voz com streaming bidirecional
Instale a biblioteca de cliente
Python
Antes de instalar a biblioteca, certifique-se de que preparou o seu ambiente para o desenvolvimento em Python.
pip install --upgrade google-cloud-texttospeech
Envie uma stream de texto e receba uma stream de áudio
A API aceita um fluxo de pedidos do tipo StreamingSynthesizeRequest, que contêm StreamingSynthesisInput ou StreamingSynthesizeConfig.
Antes de enviar uma stream StreamingSynthesizeRequest com StreamingSynthesisInput, que fornece entrada de texto, envie exatamente um StreamingSynthesizeRequest com um StreamingSynthesizeConfig.
A conversão de texto em voz de streaming só é compatível com o Chirp 3: vozes em HD.
Python
Antes de executar o exemplo, certifique-se de que preparou o seu ambiente para o desenvolvimento em Python.
Limpar
Para evitar cobranças desnecessárias da Google Cloud Platform, use o Google Cloud console para eliminar o seu projeto se não precisar dele.
O que se segue?
- Saiba mais sobre o Cloud Text-to-Speech lendo as noções básicas.
- Reveja a lista de vozes disponíveis que pode usar para a voz sintética.