Transcreva voz em texto através de bibliotecas cliente
Esta página mostra-lhe como enviar um pedido de reconhecimento de voz para o Speech-to-Text na sua linguagem de programação favorita através das Google Cloud bibliotecas cliente.
A conversão de voz em texto permite a integração fácil das tecnologias de reconhecimento de voz da Google nas aplicações dos programadores. Pode enviar dados de áudio para a API Speech-to-Text, que devolve uma transcrição de texto desse ficheiro de áudio. Para mais informações acerca do serviço, consulte o artigo Noções básicas de conversão de voz em texto.
Antes de começar
Antes de poder enviar um pedido para a API Speech-to-Text, tem de ter concluído as seguintes ações. Consulte a página antes de começar para ver detalhes.
- Ative a conversão de voz em texto num Google Cloud projeto.
- Certifique-se de que a faturação está ativada para o Speech-to-Text.
-
Instale a CLI Google Cloud. Após a instalação, inicialize a CLI gcloud executando o seguinte comando:
gcloud init
Se estiver a usar um fornecedor de identidade (IdP) externo, primeiro tem de iniciar sessão na CLI gcloud com a sua identidade federada.
-
If you're using a local shell, then create local authentication credentials for your user account:
gcloud auth application-default login
You don't need to do this if you're using Cloud Shell.
If an authentication error is returned, and you are using an external identity provider (IdP), confirm that you have signed in to the gcloud CLI with your federated identity.
- Valide que tem as autorizações necessárias para concluir este guia. Se criou um novo projeto para este guia, já tem as autorizações necessárias.
- (Opcional) Crie um novo contentor do Cloud Storage para armazenar os seus dados de áudio.
Funções necessárias
Para receber as autorizações de que
precisa para transcrever voz em texto,
peça ao seu administrador para lhe conceder a
função de IAM Consumidor de utilização de serviços (roles/serviceusage.serviceUsageConsumer
)
no seu projeto.
Para mais informações sobre a atribuição de funções, consulte o artigo Faça a gestão do acesso a projetos, pastas e organizações.
Também pode conseguir as autorizações necessárias através de funções personalizadas ou outras funções predefinidas.
Instale a biblioteca de cliente
Go
go get cloud.google.com/go/speech/apiv1
Java
If you are using Maven, add
the following to your pom.xml
file. For more information about
BOMs, see The Google Cloud Platform Libraries BOM.
If you are using Gradle, add the following to your dependencies:
If you are using sbt, add the following to your dependencies:
If you're using Visual Studio Code, IntelliJ, or Eclipse, you can add client libraries to your project using the following IDE plugins:
The plugins provide additional functionality, such as key management for service accounts. Refer to each plugin's documentation for details.
Node.js
Antes de instalar a biblioteca, certifique-se de que preparou o seu ambiente para o desenvolvimento de Node.js.
npm install @google-cloud/speech
Python
Antes de instalar a biblioteca, certifique-se de que preparou o seu ambiente para o desenvolvimento em Python.
pip install --upgrade google-cloud-speech
Faça um pedido de transcrição de áudio
Agora, pode usar a conversão de voz em texto para transcrever um ficheiro de áudio
em texto. Use o seguinte código para enviar um pedido recognize
à API Speech-to-Text.
Go
Java
Node.js
Antes de executar o exemplo, certifique-se de que preparou o seu ambiente para o desenvolvimento de Node.js.
Python
Antes de executar o exemplo, certifique-se de que preparou o seu ambiente para o desenvolvimento em Python.
Parabéns! Enviou o seu primeiro pedido de conversão de voz em texto.
Se receber um erro ou uma resposta vazia do serviço Speech-to-Text, consulte os passos de resolução de problemas e mitigação de erros.
Limpar
Para evitar incorrer em cobranças na sua Google Cloud conta pelos recursos usados nesta página, siga estes passos.
- Use o Google Cloud console para eliminar o projeto se não precisar dele.
O que se segue?
- Pratique a transcrição de ficheiros de áudio curtos.
- Saiba como processar em lote ficheiros de áudio longos para reconhecimento de voz.
- Saiba como transcrever áudio em streaming, como o de um microfone.
- Comece a usar a conversão de voz em texto no idioma à sua escolha através de uma biblioteca de cliente de conversão de voz em texto.
- Trabalhe com as aplicações de exemplo.
- Para o melhor desempenho, precisão e outras sugestões, consulte a documentação de práticas recomendadas.