A otimização da adaptação de fala é um recurso opcional de adaptação de fala. O Boost permite adicionar pesos numéricos a palavras e/ou frases de acordo com a frequência com que eles devem ser reconhecidos nos dados de áudio.
Recomendamos que você implemente o aumento se 1) você já tiver implementado a adaptação de fala e 2) quiser ajustar a força dos efeitos da adaptação de fala nos resultados da transcrição.
Consulte a página de conceitos de adaptação de fala para informações sobre práticas de adaptação de fala e adaptação de fala.
Confira na amostra de código a seguir como enviar uma solicitação usando o recurso de adaptação de fala.
REST
Para mais detalhes sobre o endpoint da API, consulte speech:recognize
.
Antes de usar os dados da solicitação abaixo, faça estas substituições:
- language-code: o código BCP-47 do idioma falado no seu clipe de áudio.
- phrases-to-boost: frase ou frases que você quer que a Speech-to-Text aumente, como uma matriz de strings.
- storage-bucket: um bucket do Cloud Storage
- input-audio: os dados de áudio que você quer transcrever.
Método HTTP e URL:
POST https://speech.googleapis.com/v1p1beta1/speech:recognize
Corpo JSON da solicitação:
{ "config":{ "languageCode":"language-code", "speechContexts":[{ "phrases":[phrases-to-boost], "boost": 2 }] }, "audio":{ "uri":"gs:storage-bucket/input-file" } }
Para enviar a solicitação, expanda uma destas opções:
Você receberá uma resposta JSON semelhante a esta:
{ "results": [ { "alternatives": [ { "transcript": "When deciding whether to bring an umbrella, I consider the weather", "confidence": 0.9463943 } ], "languageCode": "en-us" } ] }
Java
Node.js
Python
A seguir
- Saiba como usar o adaptador de fala em uma solicitação da Speech-to-Text.
- Revise a lista de tokens de classe compatíveis