Esta página foi traduzida pela API Cloud Translation.

Transcreva voz em texto através da CLI gcloud

Esta página mostra como enviar um pedido de reconhecimento de voz para o serviço Speech-to-Text através da ferramenta gcloud a partir da linha de comandos.

A conversão de voz em texto permite a integração fácil das tecnologias de reconhecimento de voz da Google nas aplicações dos programadores. Pode enviar dados de áudio para a API Speech-to-Text, que devolve uma transcrição de texto desse ficheiro de áudio. Para mais informações acerca do serviço, consulte o artigo Noções básicas de conversão de voz em texto.

Antes de começar

Antes de poder enviar um pedido para a API Speech-to-Text, tem de ter concluído as seguintes ações. Consulte a página antes de começar para ver detalhes.

Ative o Speech-to-Text num projeto da GCP.
1. Certifique-se de que a faturação está ativada para o Speech-to-Text.
Instale a CLI Google Cloud. Após a instalação, inicialize a CLI gcloud executando o seguinte comando:
```
gcloud init
```
Se estiver a usar um fornecedor de identidade (IdP) externo, primeiro tem de iniciar sessão na CLI gcloud com a sua identidade federada.
(Opcional) Crie um novo contentor do Google Cloud Storage para armazenar os seus dados de áudio.

Faça um pedido de transcrição de áudio

Agora, pode usar a conversão de voz em texto para transcrever um ficheiro de áudio em texto. Use o seguinte exemplo de código para enviar um pedido recognize à API Speech-to-Text.

Abra a shell da linha de comandos e execute o seguinte comando.

gcloud ml speech recognize gs://cloud-samples-tests/speech/brooklyn.flac \
    --language-code=en-US

Este comando pede que o Speech-to-Text transcreva o áudio contido num ficheiro FLAC alojado numa localização acessível publicamente.

Se o pedido for bem-sucedido, o servidor devolve uma resposta no formato JSON:

{
  "results": [
    {
      "alternatives": [
        {
          "confidence": 0.9840146,
          "transcript": "how old is the Brooklyn Bridge"
        }
      ]
    }
  ]
}

Parabéns! Enviou o seu primeiro pedido de conversão de voz em texto.

Se receber um erro ou uma resposta vazia do serviço Speech-to-Text, consulte os passos de resolução de problemas e mitigação de erros.

Limpar

Para evitar incorrer em cobranças na sua Google Cloud conta pelos recursos usados nesta página, siga estes passos.

Use o Google Cloud console para eliminar o projeto se não precisar dele.

O que se segue?

Pratique a transcrição de ficheiros de áudio curtos.
Saiba como processar em lote ficheiros de áudio longos para reconhecimento de voz.
Saiba como transcrever áudio em streaming, como o de um microfone.
Comece a usar a conversão de voz em texto no idioma da sua escolha através de uma biblioteca de cliente de conversão de voz em texto.
Trabalhe com as aplicações de exemplo.
Para o melhor desempenho, precisão e outras sugestões, consulte a documentação de práticas recomendadas.