Cloud Text-to-SpeechBeta

Conversão de texto em voz com tecnologia de aprendizado de máquina.

Avaliação gratuita

Síntese de fala de alta fidelidade

O Google Cloud Text-to-Speech permite que desenvolvedores sintetizem a fala natural com 30 vozes, disponíveis em vários idiomas e variantes. Esse produto aplica a pesquisa revolucionária da DeepMind no WaveNet e as avançadas redes neurais do Google para fornecer um áudio de alta fidelidade. Com essa API fácil de usar, é possível criar interações realistas com os usuários em diversos aplicativos e dispositivos.

Síntese de fala de alta fidelidade

Converta seu texto em voz agora mesmo

Digite o que você quer ouvir, selecione um idioma e clique em “Falar”.

Desenvolvido com a tecnologia de aprendizado de máquina do Google

Aplique os algoritmos de redes neurais de aprendizado profundo para sintetizar o texto em uma variedade de vozes e idiomas. Nossas redes neurais foram desenvolvidas com base na experiência de síntese de fala do Google.

Aprendizado de máquina do Google

Acesso exclusivo às vozes do WaveNet da DeepMind

A DeepMind fez uma pesquisa revolucionária sobre modelos de aprendizado de máquina para gerar uma fala que imita as vozes e os sons humanos de maneira mais natural. O resultado foi uma melhora de mais de 50% em relação ao desempenho humano. O Cloud Text-to-Speech oferece acesso exclusivo a várias vozes do WaveNet e continuará a adicionar mais vozes.

Vozes do WaveNet da DeepMind

Seleção entre mais de 30 vozes

O Google Cloud Text-to-Speech oferece uma seleção de mais de 30 vozes em 14 idiomas e variantes. Dessa maneira, os desenvolvedores podem escolher a voz que funciona melhor com o aplicativo que eles criaram.

Seleção entre mais de 30 vozes

Integração fácil com aplicativos e dispositivos existentes

O Cloud Text-to-Speech é compatível com todos os aplicativos ou dispositivos que podem enviar uma solicitação REST ou gRPC, incluindo smartphones, PCs, tablets e dispositivos de Internet das Coisas (IoT, na sigla em inglês), como automóveis, TVs e alto-falantes.

Integração fácil com aplicativos e dispositivos existentes

Compatibilidade com vários casos de uso comuns

Como uma API de fácil uso, o Google Cloud Text-to-Speech é uma solução flexível para criar experiências naturais para diversos casos de uso. Alguns casos de uso mais comuns são a automação do call center, as respostas interativas de dispositivos de IoT ou a conversão de texto para consumo como áudio.

Compatibilidade com vários casos de uso comuns

Recursos do Cloud Text-to-Speech

Multilíngue
Compatível com mais de 30 vozes em 14 idiomas e variantes, e mais adições em breve.
Vozes do WaveNet
Acesso multilíngue exclusivo às vozes do WaveNet da DeepMind, com fala mais natural.
Compatibilidade com texto e SSML
Personalize a fala com tags SSML que permitem adicionar pausas, números, datas, formatação de tempo e outras instruções de pronúncia.
Ajuste da taxa de fala
Personalize a taxa de fala para aumentar ou reduzir a velocidade da taxa normal em até quatro vezes.
Ajuste de tom
Personalize o tom da voz selecionada em até 20 semitons acima ou abaixo da saída padrão.
Controle do ganho de volume
Aumente o volume da saída em até 16 dB ou reduza-o para até -96 dB.
Flexibilidade no formato de áudio
Escolha dentre inúmeros formatos de áudio, incluindo mp3, Linear16 e Ogg Opus.
Perfis de áudioBETA
Otimize para o tipo de alto-falante em que a fala será reproduzida, como fones de ouvido ou telefones.

PREÇOS DO CLOUD TEXT-TO-SPEECH

Síntese de fala de alta fidelidade

O Cloud Text-to-Speech é cobrado por cada um milhão de caracteres de texto processado, após o limite gratuito inicial de um milhão de caracteres. Para mais detalhes, consulte o nosso guia de preços.

Recurso Nível gratuito mensal Uso pago
Vozes padrão (não WaveNet) 0 a 4 milhões de caracteres US$ 4,00 / 1 milhão de caracteres
Vozes do WaveNet 0 a 1 milhão de caracteres US$ 16,00 / 1 milhão de caracteres
Se você fizer pagamentos em uma moeda que não seja o dólar americano, serão aplicados os preços na sua moeda listados na página SKUs do Cloud Platform.
Há produtos ou recursos listados nesta página em versão Beta. Para mais informações sobre nossas etapas de lançamento de produtos, clique neste link.

Enviar comentários sobre…

Cloud Text-to-Speech API