Transcrever voz em texto usando o console do Google Cloud

Este guia de início rápido apresenta o Console do Cloud Speech-to-Text. Neste guia de início rápido, você criará e refinará uma transcrição e aprenderá a usar essa configuração com a API Speech-to-Text para seus próprios aplicativos.

Para saber como enviar solicitações e receber respostas usando a API REST em vez do console, consulte a página antes de começar.

Antes de começar

Antes de começar a usar o Console do Speech-to-Text, é preciso ativar a API no Console do Google Cloud Platform. As etapas abaixo mostram como executar as ações a seguir:

  • Ativar o Speech-to-Text em um projeto.
  • Verificar se o faturamento está ativado para o Speech-to-Text.

Configurar seu projeto do Google Cloud

  1. Fazer login no Console do Google Cloud

  2. Acessar a página do seletor de projetos

    É possível escolher um projeto existente ou criar um novo. Para mais detalhes sobre como criar um projeto, consulte a documentação do Google Cloud Platform.

  3. Se você criar um novo projeto, será solicitado que vincule uma conta de faturamento a esse projeto. Se você estiver usando um projeto atual, verifique se o faturamento está ativado.

    Saiba como confirmar se o faturamento está ativado para o projeto

  4. Depois de selecionar um projeto e vinculá-lo a uma conta de faturamento, é possível ativar a API Speech-to-Text. Acesse a barra Pesquisar produtos e recursos na parte superior da página e digite "speech".

  5. Selecione a API Cloud Speech-to-Text na lista de resultados.

  6. Para testar o Speech-to-Text sem vinculá-lo ao projeto, escolha a opção TESTAR ESTA API. Para ativar a API Speech-to-Text para uso com o projeto, clique em ATIVAR.

Criar uma transcrição

Use o console do Google Cloud para criar uma nova transcrição:

Configuração de áudio

  1. Abra a visão geral da Speech-to-Text.

    Captura de tela da página de Visão geral do Speech-to-Text.

  2. Clique em Criar transcrição.

    • Se esta for a primeira vez que você usa o console, será solicitado a escolher onde no Cloud Storage armazenar suas configurações e transcrições.
      Captura de tela da página Criar transcrição do Speech-to-Text.
  3. Na página Criar transcrição, Faça upload de um arquivo de áudio de origem. É possível escolher um arquivo que já está salvo no Cloud Storage ou fazer upload de um novo para o destino especificado do Cloud Storage.

  4. Selecione o tipo de codificação do arquivo de áudio enviado.

  5. Especifique a taxa de amostragem.

  6. Clique em Continuar. Você será direcionado para Opções de transcrição.

Opções de transcrição

  1. Selecione o código do idioma do seu áudio de origem. Este é o idioma falado na gravação.

  2. Escolha o modelo de transcrição que você quer usar no arquivo. A opção "Padrão" é pré-selecionada e, geralmente, nenhuma alteração é necessária, mas fazer a correspondência do modelo com o tipo de áudio pode resultar em maior precisão. Os custos do modelo variam.

    Captura de tela da página Criar transcrição do Speech-to-Text.

  3. Clique em Continuar. Você será direcionado para Adaptação do modelo.

Adaptação de modelo (opcional)

Se o áudio de origem tiver itens como palavras raras, nomes próprios ou termos reservados, e você tiver problemas com o reconhecimento, a adaptação do modelo poderá ajudar.

  1. Marque Ativar a adaptação do modelo.

  2. Escolha Recurso de adaptação única.

  3. Adicione frases relevantes e atribua a elas um valor de otimização.

    Captura de tela da página Criar transcrição do Speech-to-Text.

  4. Na coluna à esquerda, clique em Enviar para criar sua transcrição.

Revisar sua transcrição

Dependendo do tamanho do arquivo de áudio, a transcrição pode levar de minutos a horas para ser criada. Depois que sua transcrição for criada, ela estará pronta para revisão. Classificar a tabela por carimbo de data/hora ajuda você a localizar as transcrições recentes.

  1. Clique no Nome da transcrição que você quer revisar.

    Captura de tela da página Lista de transcrição do Speech-to-Text.
  2. Comparar o texto Transcrição com o arquivo de áudio

    Captura de tela da página Lista de transcrição do Speech-to-Text.
  3. Se você quiser fazer alterações, clique em Reutilizar configuração. Isso levará ao fluxo Criar transcrição com as mesmas opções pré-selecionadas, permitindo que você altere alguns itens, crie uma nova transcrição e compare os resultados.

A seguir