Transcreva voz em texto através da CLI gcloud
Esta página mostra como enviar um pedido de reconhecimento de voz para o serviço Speech-to-Text através da ferramenta gcloud
a partir da linha de comandos.
A conversão de voz em texto permite a integração fácil das tecnologias de reconhecimento de voz da Google nas aplicações dos programadores. Pode enviar dados de áudio para a API Speech-to-Text, que devolve uma transcrição de texto desse ficheiro de áudio. Para mais informações acerca do serviço, consulte o artigo Noções básicas de conversão de voz em texto.
Antes de começar
Antes de poder enviar um pedido para a API Speech-to-Text, tem de ter concluído as seguintes ações. Consulte a página antes de começar para ver detalhes.
- Ative o Speech-to-Text num projeto da GCP.
- Certifique-se de que a faturação está ativada para o Speech-to-Text.
-
Instale a CLI Google Cloud. Após a instalação, inicialize a CLI gcloud executando o seguinte comando:
gcloud init
Se estiver a usar um fornecedor de identidade (IdP) externo, primeiro tem de iniciar sessão na CLI gcloud com a sua identidade federada.
- (Opcional) Crie um novo contentor do Google Cloud Storage para armazenar os seus dados de áudio.
Faça um pedido de transcrição de áudio
Agora, pode usar a conversão de voz em texto para transcrever um ficheiro de áudio
em texto. Use o seguinte exemplo de código para enviar um pedido
recognize
à API Speech-to-Text.
Abra a shell da linha de comandos e execute o seguinte comando.
gcloud ml speech recognize gs://cloud-samples-tests/speech/brooklyn.flac \ --language-code=en-US
Este comando pede que o Speech-to-Text transcreva o áudio contido num ficheiro FLAC alojado numa localização acessível publicamente.
Se o pedido for bem-sucedido, o servidor devolve uma resposta no formato JSON:
{ "results": [ { "alternatives": [ { "confidence": 0.9840146, "transcript": "how old is the Brooklyn Bridge" } ] } ] }
Parabéns! Enviou o seu primeiro pedido de conversão de voz em texto.
Se receber um erro ou uma resposta vazia do serviço Speech-to-Text, consulte os passos de resolução de problemas e mitigação de erros.
Limpar
Para evitar incorrer em cobranças na sua Google Cloud conta pelos recursos usados nesta página, siga estes passos.
- Use o Google Cloud console para eliminar o projeto se não precisar dele.
O que se segue?
- Pratique a transcrição de ficheiros de áudio curtos.
- Saiba como processar em lote ficheiros de áudio longos para reconhecimento de voz.
- Saiba como transcrever áudio em streaming, como o de um microfone.
- Comece a usar a conversão de voz em texto no idioma da sua escolha através de uma biblioteca de cliente de conversão de voz em texto.
- Trabalhe com as aplicações de exemplo.
- Para o melhor desempenho, precisão e outras sugestões, consulte a documentação de práticas recomendadas.