Converta texto em fala com som natural usando uma API desenvolvida com as melhores tecnologias de IA do Google.
Novos clientes ganham US$ 300 em créditos para gastar na Text-to-Speech.
Melhore as interações com os clientes com respostas inteligentes e realistas
Envolva os usuários com a interface do usuário de voz nos seus dispositivos e aplicativos
Personalize sua comunicação com base na preferência do usuário por voz e idioma
Vantagens
Implante as tecnologias inovadoras do Google para gerar voz com entonação similar à humana. Criada com base na experiência em síntese de fala da DeepMind, a API proporciona vozes com qualidade semelhante às humanas.
Escolha dentre um conjunto de mais de 380 vozes em mais de 50 idiomas e variantes, incluindo mandarim, hindi, espanhol, árabe, russo e muitos outros. Escolha a voz que combina mais com seu usuário e aplicativo.
Crie uma voz exclusiva para representar sua marca em todos os pontos de contato com o cliente, em vez de usar uma voz comum compartilhada com outras organizações.
Demonstração
Digite o que você quer ouvir, selecione um idioma e clique em “Speak It”.
Principais recursos
Internacionalize sua experiência usando vozes pré-criadas com base na pesquisa mais recente sobre a voz personalizada.
Surpreenda seus ouvintes com conteúdo narrado profissionalmente gravado com qualidade de estúdio. Coloque seus fones de ouvido!
Treine um modelo de voz personalizada usando suas próprias gravações de áudio para criar uma voz única e mais natural para sua organização. Você pode definir e escolher o perfil de voz mais adequado à sua organização e se ajustar rapidamente às mudanças de necessidade de voz, sem precisar gravar novas frases.
Personalize o tom da voz selecionada em até 20 semitons acima ou abaixo do padrão. Ajuste sua taxa de fala para aumentar ou reduzir a velocidade da taxa normal em até quatro vezes.
Personalize sua fala com tags SSML que permitem adicionar pausas, números, datas, formatação de data e hora, e outras instruções de pronúncia.
O que há de novo
Inscreva-se na newsletter do Google Cloud para receber atualizações de produtos, informações sobre eventos, ofertas especiais e muito mais.
Documentação
Casos de uso
Ofereça uma melhor experiência de voz para o atendimento ao cliente com bots de voz no Dialogflow que geram fala dinamicamente, em vez de reproduzir áudio estático, pré-gravado. Interaja com vozes sintetizadas de alta qualidade que proporcionam aos autores da chamada uma sensação de familiaridade e personalização.
Permita comunicações naturais com seus usuários, capacitando seus dispositivos a gerar vozes semelhantes às humanas como um leitor de texto. Crie uma interface de usuário de voz completa junto com a Speech-to-Text e a Natural Language para melhorar a experiência do usuário com interações fáceis e atrativas.
Os EPGs podem ler o texto em voz alta para fornecer uma melhor experiência de usuário aos seus clientes e atender aos requisitos de acessibilidade para seus serviços e aplicativos. Experimente a demonstração do EPG.
Implemente com facilidade a funcionalidade de conversão de texto em voz nos EPGs para oferecer uma melhor experiência de usuário aos clientes e atender aos requisitos de acessibilidade para seus serviços e aplicativos.
Todos os recursos
Voz personalizada (Beta) | Treine um modelo de síntese de fala personalizado usando suas próprias gravações de áudio para criar uma voz única e mais natural para sua organização. Você pode definir e escolher o perfil de voz mais adequado à sua organização e se ajustar rapidamente às mudanças de necessidade de voz, sem precisar gravar novas frases. Saiba mais. |
Seleção de voz e idioma | Escolha dentre uma ampla seleção de mais de 220 vozes em mais de 40 idiomas e variantes. Em breve, serão feitas mais adições. |
Vozes WaveNet | Aproveite as mais de 90 vozes WaveNet criadas com base na pesquisa inovadora da DeepMind para gerar falas que trazem um resultado significativamente mais próximo ao humano. |
Suporte a texto e SSML | Personalize sua fala com tags SSML que permitem a você adicionar pausas, números, formatação de data e hora, e outras instruções de pronúncia. |
Ajuste de tom | Personalize o tom da sua voz selecionada em até 20 semitons acima ou abaixo do padrão. |
Ajuste da taxa de fala | Aumente ou diminua a velocidade da sua fala em até quatro vezes. |
Controle do ganho de volume | Aumente o volume da saída em até 16 dB ou reduza-o em até -96 dB. |
APIs REST e gRPC integradas | Faça integrações facilmente com qualquer aplicativo ou dispositivo que possa enviar uma solicitação REST ou gRPC, incluindo telefones, PCs, tablets e dispositivos de IoT, como carros, TVs e alto-falantes. |
Flexibilidade no formato de áudio | Converta texto em MP3, Linear16, OGG Opus e vários outros formatos de áudio. |
Perfis de áudio | Otimize para o tipo de alto-falante em que sua fala deve ser reproduzida, como fones de ouvido ou linhas telefônicas. |
Preços