Esta secção demonstra como transcrever áudio em streaming, como a entrada de um microfone, para texto.
O reconhecimento de voz em streaming permite-lhe transmitir áudio para o serviço de conversão de voz em texto e receber resultados de reconhecimento de voz em streaming em tempo real à medida que o áudio é processado. Consulte também os limites de áudio para pedidos de reconhecimento de voz em streaming. O reconhecimento de voz em streaming só está disponível através do gRPC.
Realize o reconhecimento de voz em streaming num ficheiro local
Segue-se um exemplo de como realizar o reconhecimento de voz em streaming num ficheiro de áudio local. Existe um limite de 10 MB em todos os pedidos de streaming enviados para a API. Este limite aplica-se ao pedido StreamingRecognize
inicial e ao tamanho de cada mensagem individual na stream. Exceder este limite vai
gerar um erro.
Go
Para saber como instalar e usar a biblioteca cliente do Speech-to-Text, consulte o artigo Bibliotecas cliente do Speech-to-Text. Para mais informações, consulte a documentação de referência da API Go Speech-to-Text.
Para se autenticar no Speech-to-Text, configure as Credenciais padrão da aplicação. Para mais informações, consulte o artigo Configure a autenticação para um ambiente de desenvolvimento local.
Java
Para saber como instalar e usar a biblioteca cliente do Speech-to-Text, consulte o artigo Bibliotecas cliente do Speech-to-Text. Para mais informações, consulte a documentação de referência da API Java Speech-to-Text.
Para se autenticar no Speech-to-Text, configure as Credenciais padrão da aplicação. Para mais informações, consulte o artigo Configure a autenticação para um ambiente de desenvolvimento local.
Node.js
Para saber como instalar e usar a biblioteca cliente do Speech-to-Text, consulte o artigo Bibliotecas cliente do Speech-to-Text. Para mais informações, consulte a documentação de referência da API Node.js Speech-to-Text.
Para se autenticar no Speech-to-Text, configure as Credenciais padrão da aplicação. Para mais informações, consulte o artigo Configure a autenticação para um ambiente de desenvolvimento local.
Python
Para saber como instalar e usar a biblioteca cliente do Speech-to-Text, consulte o artigo Bibliotecas cliente do Speech-to-Text. Para mais informações, consulte a documentação de referência da API Python Speech-to-Text.
Para se autenticar no Speech-to-Text, configure as Credenciais padrão da aplicação. Para mais informações, consulte o artigo Configure a autenticação para um ambiente de desenvolvimento local.
Idiomas adicionais
C#: Siga as instruções de configuração do C# na página das bibliotecas cliente e, em seguida, visite a documentação de referência do Speech-to-Text para .NET.
PHP: Siga as instruções de configuração do PHP na página das bibliotecas cliente e, em seguida, visite a documentação de referência do Speech-to-Text para PHP.
Ruby: Siga as instruções de configuração do Ruby na página das bibliotecas cliente e, em seguida, visite a documentação de referência do Speech-to-Text para Ruby.
Embora possa fazer streaming de um ficheiro de áudio local para a API Speech-to-Text, é recomendável que faça o reconhecimento de áudio síncrono ou assíncrono para resultados do modo de lote.
Realize o reconhecimento de voz em streaming numa stream de áudio
A conversão de voz em texto também pode realizar o reconhecimento em streaming de áudio em tempo real.
Segue-se um exemplo de como realizar o reconhecimento de voz em streaming num fluxo de áudio recebido de um microfone:
Go
Para saber como instalar e usar a biblioteca cliente do Speech-to-Text, consulte o artigo Bibliotecas cliente do Speech-to-Text. Para mais informações, consulte a documentação de referência da API Go Speech-to-Text.
Para se autenticar no Speech-to-Text, configure as Credenciais padrão da aplicação. Para mais informações, consulte o artigo Configure a autenticação para um ambiente de desenvolvimento local.
Python
Para saber como instalar e usar a biblioteca cliente do Speech-to-Text, consulte o artigo Bibliotecas cliente do Speech-to-Text. Para mais informações, consulte a documentação de referência da API Python Speech-to-Text.
Para se autenticar no Speech-to-Text, configure as Credenciais padrão da aplicação. Para mais informações, consulte o artigo Configure a autenticação para um ambiente de desenvolvimento local.
Java
Para saber como instalar e usar a biblioteca cliente do Speech-to-Text, consulte o artigo Bibliotecas cliente do Speech-to-Text. Para mais informações, consulte a documentação de referência da API Java Speech-to-Text.
Para se autenticar no Speech-to-Text, configure as Credenciais padrão da aplicação. Para mais informações, consulte o artigo Configure a autenticação para um ambiente de desenvolvimento local.
Node.js
Estes exemplos requerem a instalação do SoX, que tem de estar disponível no seu $PATH
.
- Para MacOS:
brew install sox
. - Para a maioria das distribuições Linux:
sudo apt-get install sox libsox-fmt-all
. - Para Windows: transfira os ficheiros binários.
Para mais informações sobre a instalação e a criação de um cliente de conversão de voz em texto, consulte as bibliotecas de cliente de conversão de voz em texto.
Idiomas adicionais
C#: Siga as instruções de configuração do C# na página das bibliotecas cliente e, em seguida, visite a documentação de referência do Speech-to-Text para .NET.
PHP: Siga as instruções de configuração do PHP na página das bibliotecas cliente e, em seguida, visite a documentação de referência do Speech-to-Text para PHP.
Ruby: Siga as instruções de configuração do Ruby na página das bibliotecas cliente e, em seguida, visite a documentação de referência do Speech-to-Text para Ruby.
Realize o reconhecimento de voz em streaming sem fim
Segue-se um exemplo de como realizar o reconhecimento de voz por streaming numa stream de áudio infinita recebida de um microfone:
Python
Para saber como instalar e usar a biblioteca cliente do Speech-to-Text, consulte o artigo Bibliotecas cliente do Speech-to-Text. Para mais informações, consulte a documentação de referência da API Python Speech-to-Text.
Para se autenticar no Speech-to-Text, configure as Credenciais padrão da aplicação. Para mais informações, consulte o artigo Configure a autenticação para um ambiente de desenvolvimento local.
Java
Para saber como instalar e usar a biblioteca cliente do Speech-to-Text, consulte o artigo Bibliotecas cliente do Speech-to-Text. Para mais informações, consulte a documentação de referência da API Java Speech-to-Text.
Para se autenticar no Speech-to-Text, configure as Credenciais padrão da aplicação. Para mais informações, consulte o artigo Configure a autenticação para um ambiente de desenvolvimento local.
Node.js
Este exemplo requer que instale o SoX e que este esteja disponível no seu $PATH
.
- Para MacOS:
brew install sox
. - Para a maioria das distribuições Linux:
sudo apt-get install sox libsox-fmt-all
. - Para Windows: transfira os ficheiros binários.
Para mais informações sobre a instalação e a criação de um cliente de conversão de voz em texto, consulte as bibliotecas de cliente de conversão de voz em texto.
O que se segue?
- Saiba como medir e melhorar a precisão
Experimente
Se está a usar o Google Cloud pela primeira vez, crie uma conta para avaliar o desempenho do Speech-to-Text em cenários reais. Os novos clientes também recebem 300 USD em créditos gratuitos para executar, testar e implementar cargas de trabalho.
Experimente a conversão de voz em texto gratuitamente