Transcrever voz em texto usando as bibliotecas de cliente
Esta página mostra como enviar uma solicitação de reconhecimento de fala para o Speech-to-Text em sua linguagem de programação favorita usando as bibliotecas de cliente do Google Cloud.
A Speech-to-Text permite a fácil integração das tecnologias de reconhecimento de fala do Google nos aplicativos do desenvolvedor. Você pode enviar dados de áudio para a API Speech-to-Text, que em seguida retorna uma transcrição de texto desse arquivo de áudio. Para mais informações sobre o serviço, consulte Princípios básicos da Speech-to-Text.
Antes de começar
Antes de enviar uma solicitação para a API Speech-to-Text, é necessário concluir as ações a seguir. Consulte a página antes de começar para ver os detalhes.
- Ativar o Speech-to-Text em um projeto do Google Cloud.
- Verificar se o faturamento está ativado para o Speech-to-Text.
-
Instale a Google Cloud CLI e inicialize-a executando o seguinte comando:
gcloud init
-
Crie as credenciais de autenticação para sua Conta do Google:
gcloud auth application-default login
- (Opcional) Criar um novo bucket do Google Cloud Storage para armazenar dados de áudio.
Instale a biblioteca de cliente
Go
go get cloud.google.com/go/speech/apiv1
Java
Se você estiver usando o Maven,
adicione o código abaixo ao arquivo pom.xml
. Para mais informações sobre
BOMs, consulte BOM das bibliotecas do Google Cloud Platform.
Se você estiver usando o Gradle, adicione isto às dependências:
Se você estiver usando o sbt, adicione o seguinte às suas dependências:
Se você estiver usando o Visual Studio Code, o IntelliJ ou o Eclipse, poderá adicionar bibliotecas de cliente ao projeto usando estes plug-ins de IDE:
Os plug-ins também oferecem outras funcionalidades, como gerenciamento de chaves de contas de serviço. Consulte a documentação de cada plug-in para mais detalhes.
Node.js
Antes de instalar a biblioteca, verifique se você preparou seu ambiente para o desenvolvimento do Node.js.
npm install --save @google-cloud/speech
Python
Antes de instalar a biblioteca, verifique se você preparou seu ambiente para o desenvolvimento do Python.
pip install --upgrade google-cloud-speech
Fazer uma solicitação de transcrição de áudio
Use o Speech-to-Text para transcrever um arquivo de áudio para texto. Use o código a seguir para enviar uma solicitação
recognize
para a API Speech-to-Text.
Go
Java
Node.js
Antes de executar o exemplo, verifique se você preparou o ambiente para o desenvolvimento em Node.js.
Python
Antes de executar o exemplo, verifique se você preparou o ambiente para o desenvolvimento em Python.
Parabéns! Você enviou sua primeira solicitação para o Speech-to-Text.
Se você receber um erro ou uma resposta vazia do Speech to Text, analise as etapas de solução de problemas e de eliminação de erros.
Limpar
Para evitar cobranças na conta do Google Cloud pelos recursos usados nesta página, siga estas etapas.
- Se você não precisar do projeto, use o console do Google Cloud para excluí-lo.
A seguir
- Pratique a transcrição de arquivos de áudio curtos.
- Saiba como agrupar arquivos de áudio longos para reconhecimento de fala.
- Aprenda a transcrever o streaming de áudio, como de um microfone.
- Dê os primeiros passos com a Speech-to-Text no idioma de sua preferência usando uma biblioteca de cliente da Speech-to-Text.
- Trabalhe com os aplicativos de amostra.
- Para ter o melhor desempenho e precisão e ver outras dicas, consulte a documentação sobre práticas recomendadas.