Guia de início rápido: como usar a linha de comando

Neste guia de início rápido, apresentamos a API Cloud Text-to-Speech. Aqui, você configurará o projeto e a autorização do Google Cloud Platform e, em seguida, fará uma solicitação para que a API Text-to-Speech crie áudio a partir de texto.

Para saber mais sobre os conceitos fundamentais na API Cloud Text-to-Speech, leia Princípios básicos da API Cloud Text-to-Speech.

Antes de começar

  1. Faça login na sua Conta do Google.

    Se você ainda não tiver uma, inscreva-se.

  2. Selecione ou crie um projeto do Google Cloud Platform.

    Acessar a página Gerenciar recursos

  3. Verifique se o faturamento foi ativado no projeto do Google Cloud Platform.

    Saiba como ativar o faturamento

  4. Ativar Cloud Text-to-Speech API.

    Ativar a API

  5. Configurar autenticação:
    1. No Console do GCP, acesse a página Criar chave da conta de serviço.

      Acessar a página "Criar chave da conta de serviço"
    2. Na lista Conta de serviço, selecione Nova conta de serviço.
    3. No campo Nome da conta de serviço, insira um nome.
    4. Não selecione um valor na lista Papel. Não é necessário ter um papel para acessar esse serviço.
    5. Clique em Criar. Uma nota aparecerá informando que esta conta de serviço não tem papel.
    6. Clique em Criar sem papel. O download de um arquivo JSON que contém a chave é feito no computador.
  6. Defina a variável de ambiente GOOGLE_APPLICATION_CREDENTIALS para o caminho do arquivo JSON que contém a chave da sua conta de serviço. Essa variável só se aplica à sessão de shell atual. Dessa maneira, se você abrir uma nova sessão, defina a variável novamente.

  7. Instale e inicialize o SDK do Cloud.

Sintetizar áudio de texto

É possível converter texto em áudio por meio de uma solicitação HTTP POST para o endpoint https://texttospeech.googleapis.com/v1/text:synthesize. No corpo do comando POST, na seção de configuração de voice, especifique o tipo de voz a ser sintetizado. No campo text da seção input, especifique o texto a ser sintetizado e, na seção audioConfig, especifique o tipo de áudio a ser criado.

  1. Na linha de comando, execute a linha a seguir para sintetizar áudio de texto usando a API Text-to-Speech. O comando gcloud auth application-default print-access-token é usado para recuperar um token de autorização para a solicitação.

    A resposta é direcionada ao arquivo de saída, synthesize-text.txt.

    curl -H "Authorization: Bearer $(gcloud auth application-default print-access-token)" \
      -H "Content-Type: application/json; charset=utf-8" \
      --data "{
        'input':{
          'text':'Android is a mobile operating system developed by Google,
             based on the Linux kernel and designed primarily for
             touchscreen mobile devices such as smartphones and tablets.'
        },
        'voice':{
          'languageCode':'en-gb',
          'name':'en-GB-Standard-A',
          'ssmlGender':'FEMALE'
        },
        'audioConfig':{
          'audioEncoding':'MP3'
        }
      }" "https://texttospeech.googleapis.com/v1/text:synthesize" > synthesize-text.txt
    

    O conteúdo do arquivo synthesize-text.txt será semelhante ao seguinte:

    {
      "audioContent": "//NExAASCCIIAAhEAGAAEMW4kAYPnwwIKw/BBTpwTvB+IAxIfghUfW.."
    }
    
    
  2. A saída JSON para o comando REST contém o áudio sintetizado no formato de codificação em base64. Copie o conteúdo do campo audioContent para um novo arquivo chamado synthesize-output-base64.txt. O novo arquivo terá uma aparência semelhante à seguinte:

    //NExAARqoIIAAhEuWAAAGNmBGMY4EBcxvABAXBPmPIAF//yAuh9Tn5CEap3/o
    ...
    VVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVV
    
  3. Decodifique o conteúdo do arquivo synthesize-output-base64.txt em um novo arquivo chamado synthesized-audio.mp3. Para informações sobre a decodificação de base64, consulte Como decodificar conteúdo de áudio codificado em Base64.

    base64 synthesize-output-base64.txt --decode > synthesized-audio.mp3
    
  4. Toque o conteúdo de synthesized-audio.mp3 em um aplicativo ou dispositivo de áudio. Você também pode abrir o synthesized-audio.mp3 no navegador Chrome para tocar o áudio. Basta navegar até a pasta que contém o arquivo, por exemplo: file://my_file_path/synthesized-audio.mp3.

Limpar

Para evitar cobranças desnecessárias do Google Cloud Platform, use o Console do GCP para excluir seu projeto se ele não for necessário.

A seguir

Esta página foi útil? Conte sua opinião sobre:

Enviar comentários sobre…

Documentação da API Cloud Text-to-Speech
Precisa de ajuda? Acesse nossa página de suporte.