Cloud Text-to-Speech

Conversão de texto em voz com tecnologia de machine learning.

Faça uma avaliação gratuita Veja a documentação

Síntese de fala de alta fidelidade

A Google Cloud Text-to-Speech converte texto em fala em mais de 100 vozes em mais de 20 idiomas e variações. Ele aplica a pesquisa inovadora sobre síntese de fala (WaveNet) e as redes neurais avançadas do Google para oferecer áudio de alta fidelidade. Com essa API fácil de usar, é possível criar interações realistas com os usuários que transformam o atendimento ao cliente, a interação com o dispositivo e outros aplicativos.

Síntese de fala de alta fidelidade

Converta seu texto em voz agora mesmo

Digite o que você quer ouvir, selecione um idioma e clique em “Falar”.

Desenvolvido com a tecnologia de machine learning do Google

Aplique os algoritmos de redes neurais de aprendizado profundo para sintetizar o texto em uma variedade de vozes e idiomas. Nossas redes neurais foram desenvolvidas com base na experiência de síntese de fala do Google.

Machine Learning do Google

Seleção entre mais de 100 vozes

A Google Cloud Text-to-Speech oferece uma seleção de mais de 100 vozes em 20 idiomas e variações. Assim, os desenvolvedores podem escolher a voz que funciona melhor com o aplicativo que eles criaram.

Seleção entre mais de 100 vozes

Inclui acesso exclusivo à tecnologia WaveNet

O DeepMind fez uma pesquisa inovadora sobre modelos de machine learning para gerar uma fala que imita as vozes e os sons humanos de maneira mais natural. O resultado foi uma melhoria de mais de 70% em relação ao desempenho humano. O Cloud Text-to-Speech oferece acesso exclusivo a mais de 50 vozes do WaveNet e continuará a adicionar mais vozes.

Vozes do WaveNet da DeepMind

Integração fácil com aplicativos e dispositivos

A Cloud Text-to-Speech é compatível com todos os aplicativos ou dispositivos que podem enviar uma solicitação REST ou gRPC, incluindo smartphones, PCs, tablets e dispositivos de Internet das Coisas (IoT, na sigla em inglês), como automóveis, TVs e alto-falantes.

Integração fácil com aplicativos e dispositivos

Compatibilidade com vários casos de uso comuns

A Google Cloud Text-to-Speech, como toda API fácil de usar, é uma solução flexível para criar experiências naturais para diversos casos de uso. Os casos de uso comuns incluem automação de call centers, as respostas interativas de dispositivos de IoT ou a conversão de texto para consumo como áudio.

Compatibilidade com vários casos de uso comuns

Recursos da Cloud Text-to-Speech

Multilíngue
Compatível com mais de 100 vozes em 20 idiomas e variações, e mais adições em breve.
Vozes do WaveNet
Acesso multilíngue exclusivo às vozes do WaveNet da DeepMind, com fala mais natural.
Compatibilidade com texto e SSML
Personalize a fala com tags SSML que permitem adicionar pausas, números, datas, formatação de tempo e outras instruções de pronúncia.
Ajuste da taxa de fala
Personalize a taxa de fala para aumentar ou reduzir a velocidade da taxa normal em até quatro vezes.
Ajuste de tom
Personalize o tom da voz selecionada em até 20 semitons acima ou abaixo da saída padrão.
Controle do ganho de volume
Aumente o volume da saída em até 16 dB ou reduza-o para até -96 dB.
Flexibilidade no formato de áudio
Escolha entre inúmeros formatos de áudio, incluindo mp3, Linear16 e Ogg Opus.
Perfis de áudio
Otimize para o tipo de alto-falante em que a fala será reproduzida, como fones de ouvido ou telefones.

PREÇOS DO CLOUD TEXT-TO-SPEECH

Síntese de fala de alta fidelidade

O Cloud Text-to-Speech é cobrado por cada um milhão de caracteres de texto processado, após o limite gratuito inicial de um milhão de caracteres. Para mais detalhes, consulte o nosso guia de preços.

Recurso Nível gratuito mensal Uso pago
Vozes padrão (não WaveNet) 0 a 4 milhões de caracteres USD 4,00/1 milhão de caracteres
Vozes WaveNet 0 a 1 milhão de caracteres US$ 16,00 / 1 milhão de caracteres
Se você fizer pagamentos em uma moeda que não seja o dólar americano, serão aplicados os preços na sua moeda listados na página SKUs do Cloud Platform.
Há produtos ou recursos listados nesta página na versão Beta. Para mais informações sobre as etapas de lançamento de nossos produtos, consulte esta página.

Enviar comentários sobre…

Cloud Text-to-Speech API