Transcreva voz em texto através da CLI gcloud

Esta página mostra como enviar um pedido de reconhecimento de voz para o serviço Speech-to-Text através da ferramenta gcloud a partir da linha de comandos.

A conversão de voz em texto permite a integração fácil das tecnologias de reconhecimento de voz da Google nas aplicações dos programadores. Pode enviar dados de áudio para a API Speech-to-Text, que devolve uma transcrição de texto desse ficheiro de áudio. Para mais informações acerca do serviço, consulte o artigo Noções básicas de conversão de voz em texto.

Antes de começar

Antes de poder enviar um pedido para a API Speech-to-Text, tem de ter concluído as seguintes ações. Consulte a página antes de começar para ver detalhes.

  • Ative o Speech-to-Text num projeto da GCP.
    1. Certifique-se de que a faturação está ativada para o Speech-to-Text.
  • Instale a CLI Google Cloud. Após a instalação, inicialize a CLI gcloud executando o seguinte comando:

    gcloud init

    Se estiver a usar um fornecedor de identidade (IdP) externo, primeiro tem de iniciar sessão na CLI gcloud com a sua identidade federada.

  • (Opcional) Crie um novo contentor do Google Cloud Storage para armazenar os seus dados de áudio.

Faça um pedido de transcrição de áudio

Agora, pode usar a conversão de voz em texto para transcrever um ficheiro de áudio em texto. Use o seguinte exemplo de código para enviar um pedido recognize à API Speech-to-Text.

Abra a shell da linha de comandos e execute o seguinte comando.

gcloud ml speech recognize gs://cloud-samples-tests/speech/brooklyn.flac \
    --language-code=en-US

Este comando pede que o Speech-to-Text transcreva o áudio contido num ficheiro FLAC alojado numa localização acessível publicamente.

Se o pedido for bem-sucedido, o servidor devolve uma resposta no formato JSON:

{
  "results": [
    {
      "alternatives": [
        {
          "confidence": 0.9840146,
          "transcript": "how old is the Brooklyn Bridge"
        }
      ]
    }
  ]
}

Parabéns! Enviou o seu primeiro pedido de conversão de voz em texto.

Se receber um erro ou uma resposta vazia do serviço Speech-to-Text, consulte os passos de resolução de problemas e mitigação de erros.

Limpar

Para evitar incorrer em cobranças na sua Google Cloud conta pelos recursos usados nesta página, siga estes passos.

O que se segue?