Transcrever uma voz em texto usando a gcloud CLI
Veja nesta página como enviar uma solicitação de reconhecimento de fala para
o Speech-to-Text usando a ferramenta gcloud
a partir da
linha de comando.
O Speech-to-Text permite a fácil integração das tecnologias de reconhecimento de fala do Google nos aplicativos do desenvolvedor. Você pode enviar dados de áudio para a API Speech-to-Text, que em seguida retorna uma transcrição de texto desse arquivo de áudio. Para mais informações sobre o serviço , consulte Conceitos básicos do Speech-to-Text.
Antes de começar
Antes de enviar uma solicitação para a API Speech-to-Text, é necessário concluir as ações a seguir. Consulte a página antes de começar para ver os detalhes.
- Ative o Speech-to-Text em um projeto do GCP.
- Verifique se o faturamento está ativado para o Speech-to-Text.
-
Instale a CLI do Google Cloud. Após a instalação, inicialize a CLI do Google Cloud executando o seguinte comando:
gcloud init
Ao usar um provedor de identidade (IdP) externo, primeiro faça login na gcloud CLI com sua identidade federada.
- (Opcional) Criar um novo bucket do Google Cloud Storage para armazenar dados de áudio.
Fazer uma solicitação de transcrição de áudio
Use o Speech-to-Text para transcrever um arquivo de áudio para
texto. Use o exemplo de código a seguir para enviar uma solicitação
recognize
para a API Speech-to-Text.
Abra o shell da linha de comando e execute este comando.
gcloud ml speech recognize gs://cloud-samples-tests/speech/brooklyn.flac \ --language-code=en-US
Este comando solicita que o Speech-to-Text transcreva o áudio contido em um FLAC hospedado em um local acessível ao público.
Se a solicitação for bem-sucedida, o servidor retornará uma resposta no formato JSON:
{ "results": [ { "alternatives": [ { "confidence": 0.9840146, "transcript": "how old is the Brooklyn Bridge" } ] } ] }
Parabéns! Você enviou sua primeira solicitação para o Speech-to-Text.
Se você receber um erro ou uma resposta vazia do Speech to Text, confira as etapas de solução de problemas e de mitigação de erros.
Limpeza
Para evitar cobranças na conta do Google Cloud pelos recursos usados nesta página, siga as etapas abaixo.
- Use o Google Cloud console Console do Cloud para excluir seu projeto se você não precisar dele.
A seguir
- Pratique a transcrição de arquivos de áudio curtos.
- Saiba como agrupar arquivos de áudio longos para reconhecimento de fala.
- Aprenda a transcrever o streaming de áudio, como de um microfone.
- Comece a usar o Speech-to-Text no idioma de sua preferência usando uma biblioteca de cliente do Speech-to-Text.
- Trabalhe com os aplicativos de exemplo.
- Para ter o melhor desempenho e acurácia e ver outras dicas, consulte a documentação sobre Práticas recomendadas.