Transcrever voz em texto usando a gcloud CLI
Descubra nesta página como enviar uma
solicitação de reconhecimento de fala à
Cloud Speech-to-Text usando a ferramenta
gcloud na linha de comando.
A Cloud Speech-to-Text permite a fácil integração das tecnologias de reconhecimento de fala do Google nos aplicativos do desenvolvedor. Você pode enviar dados de áudio à API Cloud Speech-to-Text e ela retorna uma transcrição em texto do arquivo de áudio. Para saber mais sobre o serviço, consulte Noções básicas da Cloud STT.
Antes de começar
Antes de enviar uma solicitação à API Cloud Speech-to-Text, realize as ações abaixo. Consulte a página Antes de começar para saber mais.
- Ative a Cloud Speech-to-Text em um projeto do GCP.
- Verifique se o faturamento está ativado para a Cloud Speech-to-Text.
-
Instale a CLI do Google Cloud. Após a instalação, inicialize a CLI do Google Cloud executando o seguinte comando:
gcloud initAo usar um provedor de identidade (IdP) externo, primeiro faça login na gcloud CLI com sua identidade federada.
- (Opcional) Criar um bucket do Google Cloud Storage para armazenar dados de áudio.
Fazer uma solicitação de transcrição de áudio
Agora é possível usar a Cloud STT para transcrever um arquivo de áudio
em texto. Use o exemplo de código a seguir para enviar
uma solicitação recognize à API Cloud Speech-to-Text.
Abra o shell da linha de comando e execute o comando a seguir.
gcloud ml speech recognize gs://cloud-samples-tests/speech/brooklyn.flac \ --language-code=en-US
Esse comando solicita que a Cloud STT transcreva o áudio de um FLAC hospedado em um local acessível de maneira pública.
Se a solicitação for bem-sucedida, o servidor vai retornar uma resposta no formato JSON:
{
"results": [
{
"alternatives": [
{
"confidence": 0.9840146,
"transcript": "how old is the Brooklyn Bridge"
}
]
}
]
}Parabéns! Você enviou sua primeira solicitação à Cloud STT.
Se você receber um erro ou uma resposta vazia da Cloud STT, analise as etapas de solução de problemas e mitigação de erros.
Limpeza
Para evitar cobranças na conta do Google Cloud pelos recursos usados nesta página, siga as etapas abaixo.
- Use o Google Cloud console para excluir o projeto, se você não precisar mais dele.
A seguir
- Pratique a transcrição de arquivos de áudio curtos.
- Saiba como agrupar arquivos de áudio longos para reconhecimento de fala.
- Aprenda a transcrever áudios de streaming, por exemplo, de um microfone.
- Comece a usar a Cloud STT no seu idioma preferencial com uma biblioteca de cliente da Cloud STT.
- Trabalhe com os aplicativos de amostra.
- Consulte a documentação de práticas recomendadas para ter melhor desempenho e acurácia e conferir outras dicas.