Sintetizar fala com streaming bidirecional
Este documento orienta sobre o processo de sintetização de áudio com streaming bidirecional.
Com o streaming bidirecional, é possível enviar entradas de texto e receber dados de áudio simultaneamente. Isso significa que você pode começar a sintetizar a fala antes que o texto de entrada completo seja enviado, o que reduz a latência e permite interações em tempo real. Assistentes de voz e jogos interativos usam streaming bidirecional para criar aplicativos mais dinâmicos e responsivos.
Para saber mais sobre os conceitos básicos do Text-to-Speech, leia Princípios básicos do Text-to-Speech.
Antes de começar
Antes de enviar uma solicitação para a API Text-to-Speech, é preciso concluir as ações a seguir. Consulte a página antes de começar para ver os detalhes.
- Ativar a Text-to-Speech em um projeto do Google Cloud.
- Verificar se o faturamento está ativado para o Text-to-Speech.
-
After installing the Google Cloud CLI, configure the gcloud CLI to use your federated identity and then initialize it by running the following command:
gcloud init
Sintetizar fala com streaming bidirecional
Instale a biblioteca de cliente
Python
Antes de instalar a biblioteca, verifique se você preparou seu ambiente para o desenvolvimento do Python.
pip install --upgrade google-cloud-texttospeech
Enviar um stream de texto e receber um stream de áudio
A API aceita um fluxo de solicitações com o tipo StreamingSynthesizeRequest
,
que contém StreamingSynthesisInput
ou StreamingSynthesizeConfig
.
Antes de enviar um stream StreamingSynthesizeRequest
com
StreamingSynthesisInput
, que fornece entrada de texto, envie exatamente um
StreamingSynthesizeRequest
com um StreamingSynthesizeConfig
.
A transmissão de texto em voz é compatível apenas com as vozes do Journey.
Python
Antes de executar o exemplo, verifique se você preparou o ambiente para o desenvolvimento em Python.
Limpar
Para evitar cobranças desnecessárias do Google Cloud Platform, use o console do Google Cloud para excluir o projeto se ele não for mais necessário.
A seguir
- Saiba mais sobre a Cloud Text-to-Speech lendo as noções básicas.
- Verifique a lista de vozes disponíveis que você pode usar para fala sintética.