Participe do Next' 23 entre os dias 29 e 31 de agosto e fique por dentro dos avanços mais recentes na área de IA. Faça sua inscrição hoje mesmo
Ir para
Text-to-Speech

IA da Text-to-Speech

Converta texto em fala com som natural usando uma API desenvolvida com as melhores tecnologias de IA do Google.

Novos clientes ganham US$ 300 em créditos para gastar na Text-to-Speech.

  • Melhore as interações com os clientes com respostas inteligentes e realistas

  • Envolva os usuários com a interface do usuário de voz nos seus dispositivos e aplicativos

  • Personalize sua comunicação com base na preferência do usuário por voz e idioma

Vantagens

Fala de alta fidelidade

Implante as tecnologias inovadoras do Google para gerar voz com entonação similar à humana. Criada com base na experiência em síntese de fala da DeepMind, a API proporciona vozes com qualidade semelhante às humanas.

Seleção de voz mais ampla

Escolha dentre um conjunto de mais de 380 vozes em mais de 50 idiomas e variantes, incluindo mandarim, hindi, espanhol, árabe, russo e muitos outros. Escolha a voz que combina mais com seu usuário e aplicativo.

Voz exclusiva

Crie uma voz exclusiva para representar sua marca em todos os pontos de contato com o cliente, em vez de usar uma voz comum compartilhada com outras organizações.

Demonstração

Coloque a Text-to-Speech em ação

Digite o que você quer ouvir, selecione um idioma e clique em “Speak It”.

Principais recursos

Principais recursos

Vozes Neural2

Internacionalize sua experiência usando vozes pré-criadas com base na pesquisa mais recente sobre a voz personalizada.

Vozes de estúdio (prévia)

Surpreenda seus ouvintes com conteúdo narrado profissionalmente gravado com qualidade de estúdio. Coloque seus fones de ouvido!

Voz personalizada

Treine um modelo de voz personalizada usando suas próprias gravações de áudio para criar uma voz única e mais natural para sua organização. Você pode definir e escolher o perfil de voz mais adequado à sua organização e se ajustar rapidamente às mudanças de necessidade de voz, sem precisar gravar novas frases.

Ajuste de voz

Personalize o tom da voz selecionada em até 20 semitons acima ou abaixo do padrão. Ajuste sua taxa de fala para aumentar ou reduzir a velocidade da taxa normal em até quatro vezes.

Suporte a texto e SSML

Personalize sua fala com tags SSML que permitem adicionar pausas, números, datas, formatação de data e hora, e outras instruções de pronúncia.

Ver todos os recursos

Documentação

Documentação

Princípios básicos do Google Cloud

Noções básicas sobre a Text-to-Speech

Um guia para os conceitos fundamentais do uso da API Text-to-Speech.
Guia de início rápido

Guia de início rápido: como usar a linha de comando

Configure seu projeto e autorização do Google Cloud e faça uma solicitação para a Text-to-Speech criar áudio a partir de um texto.
Princípios básicos do Google Cloud

Vozes e idiomas suportados

Procure por guias e recursos deste produto.
Princípios básicos do Google Cloud

Visão geral da voz personalizada (Beta)

Saiba como você pode criar uma voz única e mais natural com a voz personalizada usando suas próprias gravações de áudio com qualidade de estúdio.
Tutorial

WaveNet e outras vozes sintéticas

Aprenda sobre as diferentes vozes sintéticas disponíveis para uso na Text-to-Speech, incluindo as vozes premium WaveNet.
Tutorial

Como falar endereços com SSML

Este tutorial demonstra como usar a Linguagem de marcação de síntese de fala (SSML, na sigla em inglês) para gerar falas a partir de um arquivo de texto de endereços.

Não encontrou o que procura?

Casos de uso

Casos de uso

Caso de uso
Bots de voz em centrais de atendimento

Ofereça uma melhor experiência de voz para o atendimento ao cliente com bots de voz no Dialogflow que geram fala dinamicamente, em vez de reproduzir áudio estático, pré-gravado. Interaja com vozes sintetizadas de alta qualidade que proporcionam aos autores da chamada uma sensação de familiaridade e personalização.

Bots de voz na arquitetura de referência das centrais de atendimento
Caso de uso
Geração de voz em dispositivos

Permita comunicações naturais com seus usuários, capacitando seus dispositivos a gerar vozes semelhantes às humanas como um leitor de texto. Crie uma interface de usuário de voz completa junto com a Speech-to-Text e a Natural Language para melhorar a experiência do usuário com interações fáceis e atrativas.

Geração de voz na arquitetura de referência de dispositivos
Caso de uso
EPGs (guias de programação eletrônica) acessíveis

Os EPGs podem ler o texto em voz alta para fornecer uma melhor experiência de usuário aos seus clientes e atender aos requisitos de acessibilidade para seus serviços e aplicativos. Experimente a demonstração do EPG.

Implemente co