Cloud Text-to-Speech

Conversão de texto em voz com tecnologia de machine learning.

Faça uma avaliação gratuita Veja a documentação

Síntese de fala de alta fidelidade

A Google Cloud Text-to-Speech converte texto de mais de 30 idiomas e variações em fala e conta com mais de 180 vozes. Ela aplica a pesquisa inovadora sobre síntese de fala (WaveNet) e as redes neurais avançadas do Google para oferecer áudio de alta fidelidade. Com a API fácil de usar, é possível criar interações realistas com os usuários e transformar o atendimento ao cliente e a interação com dispositivos e outros aplicativos.

Síntese de fala de alta fidelidade

Converta seu texto em voz em tempo real

Digite o que você quer ouvir, selecione um idioma e clique em “Falar”.

Desenvolvido com a tecnologia de machine learning do Google

Aplique os algoritmos de redes neurais de aprendizado profundo para sintetizar o texto em uma variedade de vozes e idiomas. Nossas redes neurais foram desenvolvidas com base na experiência de síntese de fala do Google.

Machine Learning do Google

Seleção entre mais de 180 vozes

O Google Cloud Text-to-Speech oferece uma seleção de mais de 180 vozes em 30 idiomas e variações. Assim, os desenvolvedores podem escolher a voz mais adequada ao aplicativo deles.

Seleção entre mais de 180 vozes

Inclui acesso exclusivo à tecnologia WaveNet

A DeepMind fez uma pesquisa inovadora sobre modelos de machine learning para gerar uma fala que imita as vozes e os sons humanos de maneira mais natural. O resultado foi um desempenho 70% mais próximo ao humano. O Cloud Text-to-Speech oferece acesso exclusivo a mais de 90 vozes do WaveNet e está sempre aumentando.

Vozes do WaveNet da DeepMind

Integração fácil com aplicativos e dispositivos atuais

O Cloud Text-to-Speech é compatível com todos os aplicativos ou dispositivos que podem enviar uma solicitação REST ou gRPC, incluindo smartphones, PCs, tablets e dispositivos de IoT, como automóveis, TVs e alto-falantes.

Integração fácil com aplicativos e dispositivos atuais

Compatibilidade com vários casos de uso comuns

A Google Cloud Text-to-Speech, como toda API fácil de usar, é uma solução flexível para criar experiências naturais para diversos casos de uso. Os casos de uso comuns incluem automação de call centers, respostas interativas de dispositivos IoT ou conversão de texto para consumo como áudio.

Compatibilidade com vários casos de uso comuns
Símbolo do Text To Speech

Recursos do Cloud Text-to-Speech

Multilíngue
Compatível com 180 vozes em mais de 30 idiomas e variações. Em breve, serão feitas mais adições.
Vozes do WaveNet
Acesso multilíngue exclusivo a vozes do WaveNet da DeepMind, com a fala mais natural.
Compatibilidade com texto e SSML
Personalize a fala com tags SSML que permitem adicionar pausas, números, datas, formatação de horário e outras instruções de pronúncia.
Ajuste da taxa de fala
Personalize a taxa de fala para aumentar ou reduzir a velocidade da taxa normal em até quatro vezes.
Ajuste de tom
Personalize o tom da voz selecionada em até 20 semitons acima ou abaixo da saída padrão.
Controle do ganho de volume
Aumente o volume da saída em até 16 dB ou reduza-o para até -96 dB.
Flexibilidade no formato de áudio
Escolha entre inúmeros formatos de áudio, incluindo mp3, Linear16 e Ogg Opus.
Perfis de áudio
Otimize para o tipo de alto-falante em que a fala será reproduzida, como fones de ouvido ou telefones.

Preços do Cloud Text-to-Speech

Síntese de fala de alta fidelidade

O Cloud Text-to-Speech é cobrado por cada um milhão de caracteres de texto processado após o nível gratuito. Para mais detalhes, consulte o nosso guia de preços.

Recurso Nível gratuito mensal Uso pago
Vozes padrão (não WaveNet) 0 a 4 milhões de caracteres USD 4,00 / 1 milhão de caracteres
Vozes do WaveNet 0 a 1 milhão de caracteres US$ 16,00/1 milhão de caracteres
Se o pagamento for em uma moeda que não o dólar americano, serão aplicados os preços listados na página SKUs do Cloud Platform.
Logotipo do Text To Speech
Há produtos ou recursos listados nesta página que estão na versão Beta. Para mais informações sobre as etapas de lançamento de nossos produtos, acesse aqui.
Os produtos de IA do Cloud estão em conformidade com as políticas de SLA listadas aqui. Eles podem oferecer garantias de latência ou disponibilidade diferentes de outros serviços do Google Cloud.