Transcreva voz em texto através da Google Cloud consola

Este início rápido apresenta a consola do Cloud Speech-to-Text. Neste início rápido, vai criar e refinar uma transcrição, e aprender a usar esta configuração com a API Speech-to-Text para as suas próprias aplicações.

Para saber como enviar pedidos e receber respostas através da API REST em vez da consola, consulte a página Antes de começar.

Antes de começar

Antes de poder começar a usar a Speech-to-Text Console, tem de ativar a API na Google Cloud Platform Console. Os passos abaixo explicam as seguintes ações:

  • Ative a conversão de voz em texto num projeto.
  • Certifique-se de que a faturação está ativada para o Speech-to-Text.

Configure o seu Google Cloud projeto

  1. Inicie sessão na Google Cloud consola

  2. Aceda à página do seletor de projetos

    Pode escolher um projeto existente ou criar um novo. Para mais detalhes sobre a criação de um projeto, consulte a documentação da Google Cloud Platform.

  3. Se criar um novo projeto, é-lhe pedido que associe uma conta de faturação a este projeto. Se estiver a usar um projeto pré-existente, certifique-se de que tem a faturação ativada.

    Saiba como confirmar que a faturação está ativada para o seu projeto

  4. Depois de selecionar um projeto e associá-lo a uma conta de faturação, pode ativar a API Speech-to-Text. Aceda à barra Pesquisar produtos e recursos na parte superior da página e escreva "voz".

  5. Selecione a Cloud Speech-to-Text API na lista de resultados.

  6. Para experimentar a API Speech-to-Text sem a associar ao seu projeto, escolha a opção EXPERIMENTAR ESTA API. Para ativar a API Speech-to-Text para utilização com o seu projeto, clique em ATIVAR.

Funções necessárias

Para receber as autorizações de que precisa para criar uma transcrição, peça ao seu administrador para lhe conceder a função de administrador de armazenamento (roles/storage.admin) do IAM no seu projeto. Para mais informações sobre a atribuição de funções, consulte o artigo Faça a gestão do acesso a projetos, pastas e organizações.

Esta função predefinida contém as autorizações necessárias para criar uma transcrição. Para ver as autorizações exatas que são necessárias, expanda a secção Autorizações necessárias:

Autorizações necessárias

São necessárias as seguintes autorizações para criar uma transcrição:

  • storage.buckets.get
  • storage.buckets.list
  • storage.buckets.update
  • Ao nível do projeto ou do contentor:
    • storage.objects.create
    • storage.objects.delete
    • storage.objects.get
    • storage.objects.list
    • storage.objects.update

Também pode conseguir estas autorizações com funções personalizadas ou outras funções predefinidas.

Crie uma transcrição

Use a consola Google Cloud para criar uma transcrição.

Configuração de áudio

  1. Abra a vista geral da conversão de voz em texto.

    Captura de ecrã da página Vista geral da funcionalidade de conversão de voz em texto.

  2. Clique em Criar transcrição.

    • Se for a primeira vez que usa a consola, é-lhe pedido que escolha onde no Cloud Storage quer armazenar as suas configurações e transcrições.
      Captura de ecrã da página Criar transcrição da funcionalidade de conversão de voz em texto.
  3. Na página Criar transcrição, carregue um ficheiro de áudio de origem. Pode escolher um ficheiro que já esteja guardado no Cloud Storage ou carregar um novo para o destino do Cloud Storage especificado.

  4. Selecione o tipo de codificação do ficheiro de áudio carregado.

  5. Especifique a respetiva taxa de amostragem.

  6. Clique em Continuar. Aceda a Opções de transcrição.

Opções de transcrição

  1. Selecione o código do idioma do áudio de origem. Este é o idioma falado na gravação.

  2. Escolha o modelo de transcrição que quer usar no ficheiro. A opção Predefinição está pré-selecionada e, geralmente, não é necessária nenhuma alteração, mas a correspondência do modelo com o tipo de áudio pode resultar numa maior precisão. Tenha em atenção que os custos dos modelos variam.

    Captura de ecrã da página Criar transcrição da funcionalidade de conversão de voz em texto.

  3. Clique em Continuar. Aceda a Adaptação do modelo.

Adaptação do modelo (opcional)

Se o áudio de origem contiver elementos como palavras raras, nomes próprios ou termos proprietários e tiver problemas com o reconhecimento, a adaptação do modelo pode ajudar.

  1. Selecione Ativar adaptação do modelo.

  2. Escolha Recurso de adaptação único.

  3. Adicione expressões relevantes e atribua-lhes um valor de aumento.

    Captura de ecrã da página Criar transcrição da funcionalidade de conversão de voz em texto.

  4. Na coluna do lado esquerdo, clique em Enviar para criar a transcrição.

Reveja a transcrição

Consoante o tamanho do ficheiro de áudio, a transcrição pode demorar alguns minutos a ser criada. Depois de criada, a transcrição está pronta para revisão. A ordenação da tabela por data/hora permite-lhe localizar facilmente as transcrições recentes.

  1. Clique no Nome da transcrição que quer rever.

    Captura de ecrã da página da lista de transcrição de voz para texto.
  2. Compare o texto da transcrição com o ficheiro de áudio

    Captura de ecrã da página da lista de transcrição de voz para texto.
  3. Se quiser fazer alterações, clique em Reutilizar configuração. Isto direciona para o fluxo Criar transcrição com as mesmas opções pré-selecionadas, o que lhe permite alterar alguns aspetos, criar uma nova transcrição e comparar os resultados.

O que se segue?