Transcreva voz em texto usando a linha de comando
Veja nesta página como enviar uma solicitação de reconhecimento de fala para a Speech-to-Text usando a interface REST e o comando curl
.
A Speech-to-Text permite a fácil integração das tecnologias de reconhecimento de fala do Google nos aplicativos do desenvolvedor. Você pode enviar dados de áudio para a API Speech-to-Text, que em seguida retorna uma transcrição de texto desse arquivo de áudio. Para mais informações sobre o serviço, consulte Princípios básicos da Speech-to-Text.
Antes de começar
- Faça login na sua conta do Google Cloud. Se você começou a usar o Google Cloud agora, crie uma conta para avaliar o desempenho de nossos produtos em situações reais. Clientes novos também recebem US$ 300 em créditos para executar, testar e implantar cargas de trabalho.
-
No console do Google Cloud, na página do seletor de projetos, selecione ou crie um projeto do Google Cloud.
-
Verifique se o faturamento está ativado para seu projeto na nuvem. Saiba como verificar se o faturamento está ativado em um projeto.
-
Ative as APIs Speech-to-Text.
-
Verifique se você tem os seguintes papéis na projeto: Cloud Speech Administrator
Verificar os papéis
-
No console do Google Cloud, abra a página IAM.
Acessar IAM - Selecionar um projeto.
-
Encontre a linha que contém seu endereço de e-mail na coluna Participante.
Caso seu endereço de e-mail não esteja nessa coluna, isso significa que você não tem papéis.
- Na coluna Papel da linha com seu endereço de e-mail, verifique se a lista de papéis inclui os papéis necessários.
Conceder os papéis
-
No console do Google Cloud, abra a página IAM.
Acesse o IAM - Selecionar um projeto.
- Clique em CONCEDER ACESSO.
- No campo Novos participantes, digite seu endereço de e-mail.
- Na lista Selecionar um papel, escolha um.
- Para conceder outros papéis, clique em Adicionar outro papel e adicione cada papel adicional.
- Clique em Save.
-
- Instale a CLI do Google Cloud.
-
Para inicializar a CLI gcloud, execute o seguinte comando:
gcloud init
-
No console do Google Cloud, na página do seletor de projetos, selecione ou crie um projeto do Google Cloud.
-
Verifique se o faturamento está ativado para seu projeto na nuvem. Saiba como verificar se o faturamento está ativado em um projeto.
-
Ative as APIs Speech-to-Text.
-
Verifique se você tem os seguintes papéis na projeto: Cloud Speech Administrator
Verificar os papéis
-
No console do Google Cloud, abra a página IAM.
Acessar IAM - Selecionar um projeto.
-
Encontre a linha que contém seu endereço de e-mail na coluna Participante.
Caso seu endereço de e-mail não esteja nessa coluna, isso significa que você não tem papéis.
- Na coluna Papel da linha com seu endereço de e-mail, verifique se a lista de papéis inclui os papéis necessários.
Conceder os papéis
-
No console do Google Cloud, abra a página IAM.
Acesse o IAM - Selecionar um projeto.
- Clique em CONCEDER ACESSO.
- No campo Novos participantes, digite seu endereço de e-mail.
- Na lista Selecionar um papel, escolha um.
- Para conceder outros papéis, clique em Adicionar outro papel e adicione cada papel adicional.
- Clique em Save.
-
- Instale a CLI do Google Cloud.
-
Para inicializar a CLI gcloud, execute o seguinte comando:
gcloud init
Configurar a autenticação
As bibliotecas de cliente podem usar o Application Default Credentials para autenticar facilmente com as APIs do Google e enviar solicitações para essas APIs. Com esse serviço, é possível testar seu aplicativo localmente e implantá-lo sem alterar o código subjacente. Para mais informações, incluindo amostras de código, consulte o Guia de autenticação do Google Cloud.
Crie as credenciais de autenticação para sua Conta do Google:
gcloud auth application-default login
Criar um reconhecedor
Para enviar uma solicitação de reconhecimento, primeiro é necessário criar um reconhecedor. Use o comando a seguir para criar um reconhecedor.
Substitua PROJECT_ID
pelo ID do projeto do Google Cloud e RECOGNIZER_ID
por um identificador para o reconhecedor.
curl -X POST \ -H "Authorization: Bearer $(gcloud auth application-default print-access-token)" \ -H "Content-Type: application/json; charset=utf-8" \ --data "{\"languageCodes\": \"en-US\", \"model\": \"latest_long\"}" \ https://speech.googleapis.com/v2/projects/PROJECT_ID/locations/global/recognizers?recognizer_id=RECOGNIZER_ID
Fazer uma solicitação de transcrição de áudio
Use o Speech-to-Text para transcrever um arquivo de áudio para texto. Use a amostra de código a seguir para enviar uma
recognize
solicitação REST para a API Speech-to-Text.
-
Crie um arquivo de solicitação JSON com o seguinte texto e salve-o como um arquivo de texto simples
sync-request.json
. Substitua/full/path/to/audio/file.wav
pelo caminho para o arquivo de áudio que você quer transcrever:{ \"config\": { \"auto_decoding_config": {} }, \"content\": \"$(base64 -w 0 /full/path/to/audio/file.wav | sed 's/+/-/g; s/\//_/g')\" }
-
Use
curl
para fazer uma solicitaçãospeech:recognize
, passando para ela o nome de arquivo da solicitação JSON que você configurou na etapa 1:curl -s -H "Content-Type: application/json" \ -H "Authorization: Bearer "$(gcloud auth application-default print-access-token) \ https://speech.googleapis.com/v2/projects/PROJECT_ID/locations/global/recognizers/RECOGNIZER_ID:recognize \ -d @sync-request.json
Para passar o nome do arquivo ao
curl
use a opção-d
(de "dados") e coloque o sinal@
na frente do nome do arquivo. Este arquivo deve estar no mesmo diretório em que você executa o comandocurl
.Uma resposta semelhante a esta será exibida:
{ "results": [ { "alternatives": [ { "transcript": "how old is the Brooklyn Bridge", "confidence": 0.98267895 } ] } ] }
Parabéns! Você enviou sua primeira solicitação para o Speech-to-Text.
Se você receber um erro ou uma resposta vazia do Speech to Text, analise as etapas de solução de problemas e de eliminação de erros.
Limpar
Para evitar cobranças na conta do Google Cloud pelos recursos usados nesta página, siga estas etapas.
-
Opcional: revogue as credenciais de autenticação que você criou e exclua o arquivo de credenciais local:
gcloud auth application-default revoke
-
Opcional: revogar credenciais da CLI gcloud.
gcloud auth revoke
Console
gcloud CLI
Excluir um projeto do Cloud:
gcloud projects delete PROJECT_ID
A seguir
- Pratique a transcrição de arquivos de áudio curtos.
- Aprenda a transcrever o streaming de áudio, como de um microfone.
- Dê os primeiros passos com a Speech-to-Text no idioma de sua preferência usando uma biblioteca de cliente da Speech-to-Text.
- Para ter o melhor desempenho e precisão e ver outras dicas, consulte a documentação sobre práticas recomendadas.