Vous pouvez améliorer la précision des résultats de transcription obtenus avec Speech-to-Text grâce à l'adaptation de modèle. La fonctionnalité d'adaptation de modèle vous permet de spécifier des mots et/ou des expressions que Speech-to-Text doit reconnaître plus souvent dans vos données audio que d'autres alternatives, qui pourraient autrement être suggérées. L'adaptation de modèle est particulièrement utile pour améliorer la précision de la transcription dans les cas d'utilisation suivants :
- Vos données audio contiennent des mots ou des expressions qui sont susceptibles d'apparaître fréquemment.
- Vos données audio contiennent probablement des mots rares (tels que des noms propres) ou des mots qui n'existent pas dans le langage courant.
- Vos données audio contiennent du bruit ou manquent de clarté.
Pour plus d'informations sur l'utilisation de cette fonctionnalité, consultez la page Améliorer les résultats de transcription grâce à l'adaptation de modèle. Pour en savoir plus sur les limites de nombre d'expressions et de caractères par requête d'adaptation de modèle, consultez la page Quotas et limites. Certains modèles ne sont pas compatibles avec l'adaptation vocale. Consultez la page Langues acceptées pour voir les modèles compatibles avec l'adaptation.
Exemple de code
L'adaptation vocale est une configuration facultative de Speech-to-Text qui vous permet de personnaliser les résultats de transcription en fonction de vos besoins. Pour en savoir plus sur la configuration du corps de la requête de reconnaissance, consultez la documentation sur RecognitionConfig
.
L'exemple de code suivant montre comment améliorer la précision de la transcription à l'aide d'une ressource SpeechAdaptation :
PhraseSet
,
CustomClass
,
et amélioration de l'adaptation de modèle.
Pour utiliser un élément PhraseSet
ou CustomClass
dans les futures requêtes, consignez sa ressource name
, qui est renvoyée dans la réponse lorsque vous créez la ressource.
Pour obtenir la liste des classes prédéfinies disponibles pour votre langue, consultez la section Jetons de classe compatibles.
Python
Pour savoir comment installer et utiliser la bibliothèque cliente pour Speech-to-Text, consultez la page Bibliothèques clientes Speech-to-Text. Pour en savoir plus, consultez la documentation de référence de l'API Speech-to-Text en langage Python.
Pour vous authentifier auprès de Speech-to-Text, configurez le service Identifiants par défaut de l'application. Pour en savoir plus, consultez Configurer l'authentification pour un environnement de développement local.