Melhore a acurácia dos resultados de transcrição que você recebe do Speech-to-Text usando a adaptação de fala. O recurso de adaptação do modelo permite especificar palavras e/ou frases que o Speech-to-Text precisa reconhecer com mais frequência nos seus dados de áudio do que outras alternativas que podem ser sugeridas. A adaptação do modelo é especialmente útil para melhorar a acurácia da transcrição nos seguintes casos de uso:
- Seu áudio contém palavras ou frases que provavelmente ocorrerão com frequência.
- É provável que seu áudio contenha palavras raras (como nomes próprios) ou palavras que não existem no uso geral.
- Seu áudio contém ruído ou não é muito claro.
Para mais informações sobre como usar esse recurso, consulte Melhorar os resultados de transcrição com a adaptação do modelo. Para informações sobre limites de frases e caracteres por solicitação de adaptação do modelo, consulte Cotas e limites. Nem todos os modelos são compatíveis com a adaptação da fala. Consulte Suporte a idiomas para ver quais modelos são compatíveis com a adaptação.
Exemplo de código
A adaptação da fala é uma configuração opcional do Speech-to-Text que
pode ser usada para personalizar os resultados da transcrição de acordo com suas necessidades. Consulte a documentação RecognitionConfig
para mais informações sobre como configurar o corpo da solicitação
de reconhecimento.
O exemplo de código a seguir demonstra como melhorar a acurácia da transcrição usando um
recurso
SpeechAdaptation:
PhraseSet
,
CustomClass
e a otimização da adaptação do modelo.
Para usar um PhraseSet
ou um CustomClass
em solicitações futuras, anote
o recurso name
, retornado na resposta ao criar o recurso.
Para uma lista das classes pré-criadas disponíveis para sua linguagem, consulte Tokens de classe compatíveis.
Python
Para aprender a instalar e usar a biblioteca de cliente do Speech-to-Text, consulte Bibliotecas de cliente do Speech-to-Text. Para mais informações, consulte a documentação de referência da API Speech-to-Text Python.
Para se autenticar no Speech-to-Text, configure o Application Default Credentials. Para mais informações, consulte Configurar a autenticação para um ambiente de desenvolvimento local.