Transcrever voz em texto usando as bibliotecas de cliente
Esta página mostra como enviar uma solicitação de reconhecimento de fala para o Speech-to-Text em sua linguagem de programação favorita usando as bibliotecas de cliente do Google Cloud.
A Speech-to-Text permite a fácil integração das tecnologias de reconhecimento de fala do Google nos aplicativos do desenvolvedor. Você pode enviar dados de áudio para a API Speech-to-Text, que em seguida retorna uma transcrição de texto desse arquivo de áudio. Para mais informações sobre o serviço, consulte Princípios básicos da Speech-to-Text.
Antes de começar
Antes de enviar uma solicitação para a API Speech-to-Text, é necessário concluir as ações a seguir. Consulte a página antes de começar para ver os detalhes.
- Ativar o Speech-to-Text em um projeto do Google Cloud.
- Verificar se o faturamento está ativado para o Speech-to-Text.
-
Install the Google Cloud CLI, then initialize it by running the following command:
gcloud init
-
If you're using a local shell, then create local authentication credentials for your user account:
gcloud auth application-default login
You don't need to do this if you're using Cloud Shell.
- (Opcional) Criar um novo bucket do Google Cloud Storage para armazenar dados de áudio.
Instale a biblioteca de cliente
Go
go get cloud.google.com/go/speech/apiv1
Java
If you are using Maven, add
the following to your pom.xml
file. For more information about
BOMs, see The Google Cloud Platform Libraries BOM.
If you are using Gradle, add the following to your dependencies:
If you are using sbt, add the following to your dependencies:
If you're using Visual Studio Code, IntelliJ, or Eclipse, you can add client libraries to your project using the following IDE plugins:
The plugins provide additional functionality, such as key management for service accounts. Refer to each plugin's documentation for details.
Node.js
Antes de instalar a biblioteca, verifique se você preparou seu ambiente para o desenvolvimento do Node.js.
npm install --save @google-cloud/speech
Python
Antes de instalar a biblioteca, verifique se você preparou seu ambiente para o desenvolvimento do Python.
pip install --upgrade google-cloud-speech
Fazer uma solicitação de transcrição de áudio
Use o Speech-to-Text para transcrever um arquivo de áudio para texto. Use o código a seguir para enviar uma solicitação
recognize
para a API Speech-to-Text.
Go
Java
Node.js
Antes de executar o exemplo, verifique se você preparou o ambiente para o desenvolvimento em Node.js.
Python
Antes de executar o exemplo, verifique se você preparou o ambiente para o desenvolvimento em Python.
Parabéns! Você enviou sua primeira solicitação para o Speech-to-Text.
Se você receber um erro ou uma resposta vazia do Speech to Text, analise as etapas de solução de problemas e de eliminação de erros.
Limpar
Para evitar cobranças na conta do Google Cloud pelos recursos usados nesta página, siga estas etapas.
- Se você não precisar do projeto, use o console do Google Cloud para excluí-lo.
A seguir
- Pratique a transcrição de arquivos de áudio curtos.
- Saiba como agrupar arquivos de áudio longos para reconhecimento de fala.
- Aprenda a transcrever o streaming de áudio, como de um microfone.
- Dê os primeiros passos com a Speech-to-Text no idioma de sua preferência usando uma biblioteca de cliente da Speech-to-Text.
- Trabalhe com os aplicativos de amostra.
- Para ter o melhor desempenho e precisão e ver outras dicas, consulte a documentação sobre práticas recomendadas.