Nesta seção, demonstramos como transcrever áudio de streaming, como a entrada de um microfone, para texto.
O reconhecimento de voz por streaming permite que você faça streaming de áudio para Speech-to-Text e receba uma transmissão de reconhecimento de voz em tempo real conforme o áudio é processado. Consulte também os limites de áudio para transmissão de solicitações de reconhecimento de fala em streaming. O reconhecimento de fala em streaming só está disponível por gRPC.
Antes de começar
- Faça login na sua conta do Google Cloud. Se você começou a usar o Google Cloud agora, crie uma conta para avaliar o desempenho de nossos produtos em situações reais. Clientes novos também recebem US$ 300 em créditos para executar, testar e implantar cargas de trabalho.
-
No console do Google Cloud, na página do seletor de projetos, selecione ou crie um projeto do Google Cloud.
-
Verifique se a cobrança está ativada para o seu projeto do Google Cloud.
-
Ative as APIs Speech-to-Text.
-
Verifique se você tem os seguintes papéis no projeto: Cloud Speech Administrator
Verificar os papéis
-
No console do Google Cloud, abra a página IAM.
Acessar IAM - Selecionar um projeto.
-
Na coluna Principal, encontre a linha que contém seu endereço de e-mail.
Caso seu endereço de e-mail não esteja nessa coluna, isso significa que você não tem papéis.
- Na coluna Papel da linha com seu endereço de e-mail, verifique se a lista de papéis inclui os papéis necessários.
Conceder os papéis
-
No console do Google Cloud, abra a página IAM.
Acesse o IAM - Selecionar um projeto.
- Clique em CONCEDER ACESSO.
- No campo Novos participantes, digite seu endereço de e-mail.
- Na lista Selecionar um papel, escolha um.
- Para conceder outros papéis, clique em Adicionar outro papel e adicione cada papel adicional.
- Clique em Save.
-
- Install the Google Cloud CLI.
-
To initialize the gcloud CLI, run the following command:
gcloud init
-
No console do Google Cloud, na página do seletor de projetos, selecione ou crie um projeto do Google Cloud.
-
Verifique se a cobrança está ativada para o seu projeto do Google Cloud.
-
Ative as APIs Speech-to-Text.
-
Verifique se você tem os seguintes papéis no projeto: Cloud Speech Administrator
Verificar os papéis
-
No console do Google Cloud, abra a página IAM.
Acessar IAM - Selecionar um projeto.
-
Na coluna Principal, encontre a linha que contém seu endereço de e-mail.
Caso seu endereço de e-mail não esteja nessa coluna, isso significa que você não tem papéis.
- Na coluna Papel da linha com seu endereço de e-mail, verifique se a lista de papéis inclui os papéis necessários.
Conceder os papéis
-
No console do Google Cloud, abra a página IAM.
Acesse o IAM - Selecionar um projeto.
- Clique em CONCEDER ACESSO.
- No campo Novos participantes, digite seu endereço de e-mail.
- Na lista Selecionar um papel, escolha um.
- Para conceder outros papéis, clique em Adicionar outro papel e adicione cada papel adicional.
- Clique em Save.
-
- Install the Google Cloud CLI.
-
To initialize the gcloud CLI, run the following command:
gcloud init
-
Create local authentication credentials for your user account:
gcloud auth application-default login
As bibliotecas de cliente podem usar o Application Default Credentials para autenticar facilmente com as APIs do Google e enviar solicitações para essas APIs. Com esse serviço, é possível testar seu aplicativo localmente e implantá-lo sem alterar o código subjacente. Par amais informações, consulte <atrack-type="commonincludes" l10n-attrs-original-order="href,track-type,track-name" l10n-encrypted-href="WDE63JFVMK0YqIWBqG8nCycgwkRfOeEqRvzYs1N+2tJUEhcZvE5VtDH5LoWw0lj/" track-name="referenceLink"> Faça a autenticação para usar as bibliotecas do cliente.</atrack-type="commonincludes">
Verifique também se você instalou a biblioteca de cliente.
Como realizar reconhecimento de fala em streaming em um arquivo local
Veja abaixo um exemplo de reconhecimento de fala em streaming em um arquivo de áudio
local. Há um limite de 25 KB de áudio enviado nas solicitações de um stream. Esse
limite se aplica à solicitação StreamingRecognize
inicial e ao tamanho de cada mensagem individual no stream. Exceder esse limite
causará um erro.
Python
É possível fazer streaming de um arquivo de áudio local para a API Speech-to-Text, mas é recomendável que você execute o reconhecimento de áudio síncrono.
Limpeza
Para evitar cobranças na conta do Google Cloud pelos recursos usados nesta página, siga estas etapas.
-
Opcional: revogue as credenciais de autenticação que você criou e exclua o arquivo de credenciais local:
gcloud auth application-default revoke
-
Opcional: revogar credenciais da CLI gcloud.
gcloud auth revoke
Console
gcloud
Exclua um projeto do Google Cloud:
gcloud projects delete PROJECT_ID
A seguir
- Consulte a documentação de referência para reconhecimento de streaming.
- Pratique a transcrição de arquivos de áudio curtos.
- Saiba como transcrever arquivos de áudio longos.
- Transcreva arquivos de áudio usando o Chirp.
- Para dicas sobre como conseguir o melhor desempenho e precisão, entre outras, consulte a documentação sobre práticas recomendadas.