Nesta seção, demonstramos como transcrever áudio de streaming, como a entrada de um microfone, para texto.
O reconhecimento de voz por streaming permite que você faça streaming de áudio para Speech-to-Text e receba uma transmissão de reconhecimento de voz em tempo real conforme o áudio é processado. Consulte também os limites de áudio para transmissão de solicitações de reconhecimento de fala em streaming. O reconhecimento de fala em streaming só está disponível via gRPC.
Como realizar reconhecimento de fala em streaming em um arquivo local
Veja abaixo um exemplo de reconhecimento de fala em streaming em um arquivo de áudio
local. Há um limite de 10 MB em todas as solicitações de streaming enviadas à API. Esse
limite se aplica à solicitação StreamingRecognize
inicial e ao tamanho de cada mensagem individual no stream. Exceder esse limite
causará um erro.
Go
Para aprender a instalar e usar a biblioteca de cliente da Speech-to-Text, consulte Bibliotecas de cliente da Speech-to-Text. Para mais informações, consulte a documentação de referência da API Speech-to-Text Go.
Para autenticar no Speech-to-Text, configure o Application Default Credentials. Para mais informações, consulte Configurar a autenticação para um ambiente de desenvolvimento local.
Java
Para aprender a instalar e usar a biblioteca de cliente da Speech-to-Text, consulte Bibliotecas de cliente da Speech-to-Text. Para mais informações, consulte a documentação de referência da API Speech-to-Text Java.
Para autenticar no Speech-to-Text, configure o Application Default Credentials. Para mais informações, consulte Configurar a autenticação para um ambiente de desenvolvimento local.
Node.js
Para aprender a instalar e usar a biblioteca de cliente da Speech-to-Text, consulte Bibliotecas de cliente da Speech-to-Text. Para mais informações, consulte a documentação de referência da API Speech-to-Text Node.js.
Para autenticar no Speech-to-Text, configure o Application Default Credentials. Para mais informações, consulte Configurar a autenticação para um ambiente de desenvolvimento local.
Python
Para aprender a instalar e usar a biblioteca de cliente da Speech-to-Text, consulte Bibliotecas de cliente da Speech-to-Text. Para mais informações, consulte a documentação de referência da API Speech-to-Text Python.
Para autenticar no Speech-to-Text, configure o Application Default Credentials. Para mais informações, consulte Configurar a autenticação para um ambiente de desenvolvimento local.
Outras linguagens
C#: Siga as instruções de configuração do C# na página das bibliotecas de cliente e, em seguida, acesse a documentação de referência do Speech-to-Text para .NET.
PHP: Siga as instruções de configuração do PHP na página das bibliotecas de cliente e, em seguida, acesse a documentação de referência da Speech-to-Text para PHP.
Ruby: Siga as instruções de configuração do Ruby na página das bibliotecas de cliente e, em seguida, acesse a documentação de referência do Speech-to-Text para Ruby.
Ainda que seja possível fazer streaming de um arquivo de áudio local para a API Speech-to-Text, recomendamos realizar o reconhecimento de áudio síncrono ou assíncrono para receber os resultados no modo de lote.
Como realizar reconhecimento de fala em streaming em um stream de áudio
A Speech-to-Text também pode realizar reconhecimento em streaming, áudio em tempo real.
Este é um exemplo de reconhecimento de fala em streaming em um stream de áudio recebido de um microfone:
Go
Para aprender a instalar e usar a biblioteca de cliente da Speech-to-Text, consulte Bibliotecas de cliente da Speech-to-Text. Para mais informações, consulte a documentação de referência da API Speech-to-Text Go.
Para autenticar no Speech-to-Text, configure o Application Default Credentials. Para mais informações, consulte Configurar a autenticação para um ambiente de desenvolvimento local.
Python
Para aprender a instalar e usar a biblioteca de cliente da Speech-to-Text, consulte Bibliotecas de cliente da Speech-to-Text. Para mais informações, consulte a documentação de referência da API Speech-to-Text Python.
Para autenticar no Speech-to-Text, configure o Application Default Credentials. Para mais informações, consulte Configurar a autenticação para um ambiente de desenvolvimento local.
Java
Para aprender a instalar e usar a biblioteca de cliente da Speech-to-Text, consulte Bibliotecas de cliente da Speech-to-Text. Para mais informações, consulte a documentação de referência da API Speech-to-Text Java.
Para autenticar no Speech-to-Text, configure o Application Default Credentials. Para mais informações, consulte Configurar a autenticação para um ambiente de desenvolvimento local.
Node.js
Para essas amostras, é preciso que você instale o SoX e que ele esteja disponível no $PATH
.
- Para Mac OS:
brew install sox
. - Para a maioria das distribuições do Linux:
sudo apt-get install sox libsox-fmt-all
. - Para Windows: faça o download dos binários.
Para mais informações sobre como instalar e criar um cliente Speech-to-Text, consulte Bibliotecas de cliente Speech-to-Text.
Outras linguagens
C#: Siga as instruções de configuração do C# na página das bibliotecas de cliente e, em seguida, acesse a documentação de referência do Speech-to-Text para .NET.
PHP: Siga as instruções de configuração do PHP na página das bibliotecas de cliente e, em seguida, acesse a documentação de referência da Speech-to-Text para PHP.
Ruby: Siga as instruções de configuração do Ruby na página das bibliotecas de cliente e, em seguida, acesse a documentação de referência do Speech-to-Text para Ruby.
Executar o reconhecimento de fala em streaming contínuo
Este é um exemplo de reconhecimento de fala em streaming em um stream de áudio contínuo recebido de um microfone:
Python
Para aprender a instalar e usar a biblioteca de cliente da Speech-to-Text, consulte Bibliotecas de cliente da Speech-to-Text. Para mais informações, consulte a documentação de referência da API Speech-to-Text Python.
Para autenticar no Speech-to-Text, configure o Application Default Credentials. Para mais informações, consulte Configurar a autenticação para um ambiente de desenvolvimento local.
Java
Para aprender a instalar e usar a biblioteca de cliente da Speech-to-Text, consulte Bibliotecas de cliente da Speech-to-Text. Para mais informações, consulte a documentação de referência da API Speech-to-Text Java.
Para autenticar no Speech-to-Text, configure o Application Default Credentials. Para mais informações, consulte Configurar a autenticação para um ambiente de desenvolvimento local.
Node.js
Para esses exemplos, é preciso instalar o SoX e ele precisa estar disponível no $PATH
.
- Para Mac OS:
brew install sox
. - Para a maioria das distribuições do Linux:
sudo apt-get install sox libsox-fmt-all
. - Para Windows: faça o download dos binários.
Para mais informações sobre como instalar e criar um cliente Speech-to-Text, consulte Bibliotecas de cliente Speech-to-Text.
A seguir
- Saiba como avaliar e melhorar a precisão
Faça um teste
Se você ainda não conhece o Google Cloud, crie uma conta para avaliar o desempenho da Speech-to-Text em cenários reais. Clientes novos também recebem US$ 300 em créditos para executar, testar e implantar cargas de trabalho.
Faça um teste gratuito da Speech-to-Text