Informações gerais
O ajuste da Speech-to-Text permite que você personalize um modelo de fala existente usando seus dados exclusivos de áudio e texto para aumentar a precisão do seu serviço de reconhecimento de fala.
O ajuste de modelo de fala pode ser usado para aprimorar um modelo de fala básico e melhorar o reconhecimento de transcrição em condições acústicas desafiadoras, incluindo sirenes, ruídos altos, ruído de fundo excessivo, incluindo música ou outras conversas, e vocabulário exclusivo, incluindo nomes de produtos específicos do cliente ou terminologia e sotaques únicos.
Acessível no console e na API do Google Cloud, o ajuste do modelo de fala permite treinar, avaliar e implantar um modelo de fala dedicado em um ambiente integrado sem código. Para treinamento, você pode fornecer apenas dados de áudio que representem suas condições de áudio, sem transcrições de referência como um conjunto de treinamento. No entanto, você precisa fornecer dados de áudio e as transcrições de referência como parte do seu conjunto de avaliação.
A seguir
Para aproveitar o ajuste do modelo de fala no seu aplicativo, siga o recurso abaixo para implantar seu modelo: