Melhore a precisão dos resultados de transcrição que recebe da Speech-to-Text usando a adaptação de fala. O recurso de adaptação de fala permite especificar palavras e/ou frases que o STT precisa reconhecer com mais frequência nos dados de áudio do que outras alternativas que, de outra forma, poderiam ser sugeridas. A adaptação de fala é particularmente útil para melhorar a precisão da transcrição nos seguintes casos:
- Seu áudio contém palavras/frases que podem ocorrer com muita frequência.
- É provável que seu áudio contenha palavras raras (como nomes próprios) ou palavras que não existem para uso geral.
- Seu áudio contém ruído ou não é muito claro.
Consulte a página de conceitos de adaptação de fala para informações sobre práticas de adaptação de fala e adaptação de fala.
A amostra de código a seguir mostra como melhorar a precisão da transcrição definindo contextos de fala em uma solicitação enviada à API Speech-to-Text. Consulte a página tokens de classe para ver uma lista das classes disponíveis para seu idioma.
REST e LINHA DE CMD
Consulte o endpoint da API speech:recognize
para ver todos os detalhes.
Antes de usar os dados da solicitação abaixo, faça as substituições a seguir:
- language-code: o código BCP-47 do idioma falado no seu clipe de áudio.
- phrases-to-boost: frase ou frases que você quer que a Speech-to-Text aumente, como uma matriz de strings.
- storage-bucket: um bucket do Cloud Storage
- input-audio: os dados de áudio que você quer transcrever.
Método HTTP e URL:
POST https://speech.googleapis.com/v1p1beta1/speech:recognize
Corpo JSON da solicitação:
{ "config":{ "languageCode":"language-code", "speechContexts":[{ "phrases":[phrases-to-boost], "boost": 2 }] }, "audio":{ "uri":"gs:storage-bucket/input-file" } }
Para enviar a solicitação, expanda uma destas opções:
Você receberá uma resposta JSON semelhante a esta:
{ "results": [ { "alternatives": [ { "transcript": "When deciding whether to bring an umbrella, I consider the weather", "confidence": 0.9463943 } ], "languageCode": "en-us" } ] }
Java
Node.js
Python
Go