Nesta página, veja como aplicar a pontuação automática nos resultados de transcrição do Speech-to-Text. Quando você ativa esse recurso, o Speech-to-Text infere automaticamente a presença de pontos, vírgulas e pontos de interrogação nos dados de áudio e os adiciona à transcrição.
Por padrão, o Speech-to-Text não inclui sinais de pontuação nos resultados do reconhecimento de fala. No entanto, é possível solicitar que o Speech-to-Text detecte e insira pontuação automaticamente nos resultados da transcrição. Quando você ativa a pontuação automática, o Speech-to-Text também coloca em maiúscula a primeira letra após cada ponto e ponto de interrogação.
Para ativar a pontuação automática, defina o campo enableAutomaticPunctuation
como true
nos parâmetros RecognitionConfig
da solicitação. A API Speech-to-Text suporta pontuação automática para todos os métodos de reconhecimento de fala: speech:recognize
, speech:longrunningrecognize
e Streaming.
As amostras de código a seguir demonstram como detectar os detalhes da pontuação automática em uma solicitação de transcrição.
Protocolo
Consulte o endpoint da APIspeech:recognize
para ver todos os detalhes.
Para executar o reconhecimento de fala síncrono, faça uma solicitação POST
e forneça o corpo apropriado a ela. Veja a seguir um exemplo de uma solicitação POST
usando curl
. O exemplo usa o token de acesso de uma conta de serviço configurada para o
projeto usando a
Google Cloud CLI. Para instruções sobre como instalar a gcloud CLI,
configurar um projeto com uma conta de serviço e receber um token de acesso,
consulte o guia de início rápido.
curl -s -H "Content-Type: application/json" \ -H "Authorization: Bearer "$(gcloud auth print-access-token) \ https://speech.googleapis.com/v1/speech:recognize \ --data '{ "config": { "encoding":"FLAC", "sampleRateHertz": 16000, "languageCode": "en-US", "enableAutomaticPunctuation": true }, "audio": { "uri":"gs://cloud-samples-tests/speech/brooklyn.flac" } }'
Consulte a documentação de referência RecognitionConfig
para mais informações sobre como configurar o corpo da solicitação.
Quando a solicitação é bem-sucedida, o servidor retorna um código de status HTTP 200 OK
e a resposta no formato JSON:
{ "results": [ { "alternatives": [ { "transcript": "How old is the Brooklyn Bridge?", "confidence": 0.98360395 } ] } ] }
Go
Para autenticar no Speech-to-Text, configure o Application Default Credentials. Para mais informações, consulte Configurar a autenticação para um ambiente de desenvolvimento local.
Java
Para autenticar no Speech-to-Text, configure o Application Default Credentials. Para mais informações, consulte Configurar a autenticação para um ambiente de desenvolvimento local.
Node.js
Para autenticar no Speech-to-Text, configure o Application Default Credentials. Para mais informações, consulte Configurar a autenticação para um ambiente de desenvolvimento local.
Python
Para autenticar no Speech-to-Text, configure o Application Default Credentials. Para mais informações, consulte Configurar a autenticação para um ambiente de desenvolvimento local.
Outras linguagens
C#: Siga as Instruções de configuração do C# na página das bibliotecas de cliente e acesse Documentação de referência da Speech-to-Text para .NET.
PHP: Siga as Instruções de configuração do PHP na página das bibliotecas de cliente e acesse Documentação de referência da Speech-to-Text para PHP.
Ruby: Siga as Instruções de configuração do Ruby na página das bibliotecas de cliente e acesse Documentação de referência da Speech-to-Text para Ruby.
A seguir
Veja como fazer solicitações síncronas de transcrição.