Cette page explique comment activer la reconnaissance de la langue pour les requêtes de transcription audio envoyées à Speech-to-Text.
Dans certaines situations, vous ne connaissez pas avec certitude la langue de vos enregistrements audio. Par exemple, si vous publiez votre service, votre application ou votre produit dans un pays où plusieurs langues officielles sont parlées, il est possible que vous receviez des entrées audio des utilisateurs dans différentes langues. Cela peut complexifier considérablement la spécification d'un code de langue unique pour les requêtes de transcription.
Reconnaissance multilingue
Speech-to-Text vous permet de spécifier un ensemble de langues alternatives que vos données audio peuvent contenir. Lorsque vous envoyez une requête de transcription audio à Speech-to-Text, vous pouvez fournir une liste de langues supplémentaires pouvant être parlées dans les données audio. Si vous incluez une liste de langues dans votre requête, Speech-to-Text tente de transcrire le fichier audio en se basant sur la langue correspondant le mieux à l'échantillon par les alternatives que vous spécifiez. Speech-to-Text identifie ensuite les résultats de la transcription en leur attribuant le code de langue prédit.
L'utilisation de cette fonctionnalité convient parfaitement aux applications devant transcrire des instructions courtes, telles que des commandes ou des recherches vocales. Vous pouvez répertorier jusqu'à trois langues alternatives parmi celles disponibles dans Speech-to-Text en plus de votre langue principale, soit un total de quatre langues.
Même si vous pouvez spécifier d'autres langues dans votre requête de transcription vocale, vous devez tout de même fournir un code de langue principal dans le champ languageCode
. De plus, vous devez limiter autant que possible le nombre de codes de langues que vous spécifiez. Plus le nombre de codes de langues alternatives est faible, plus la sélection du code approprié sera facile pour Speech-to-Text. Une requête ne spécifiant qu'une seule langue sera celle renvoyant les meilleurs résultats.
Activer la reconnaissance de la langue dans les requêtes de transcription audio
Pour spécifier d'autres langues dans votre transcription de fichier audio, vous devez définir le champ alternativeLanguageCodes
sur une liste de codes de langue dans les paramètres RecognitionConfig
de la requête. Speech-to-Text autorise la spécification de langues alternatives pour toutes les méthodes de reconnaissance vocale, à savoir speech:recognize
, speech:longrunningrecognize
et Streaming.
Utiliser un fichier local
Protocole
Reportez-vous au point de terminaison speech:recognize
de l'API pour obtenir des informations complètes.
Pour réaliser une reconnaissance vocale synchrone, exécutez une requête POST
en fournissant le corps de requête approprié. Voici un exemple de requête POST
utilisant curl
. L'exemple utilise Google Cloud CLI pour générer un jeton d'accès. Pour obtenir des instructions sur l'installation de gcloud CLI, consultez le guide de démarrage rapide.
L'exemple suivant montre comment obtenir la transcription d'un fichier audio pouvant inclure des phrases prononcées en anglais, en allemand ou en français.
curl -s -H "Content-Type: application/json" \ -H "Authorization: Bearer $(gcloud auth application-default print-access-token)" \ https://speech.googleapis.com/v1p1beta1/speech:recognize \ --data '{ "config": { "encoding": "LINEAR16", "languageCode": "en-US", "alternativeLanguageCodes": ["fr-FR", "de-DE"], "model": "command_and_search" }, "audio": { "uri": "gs://cloud-samples-tests/speech/commercial_mono.wav" } }' > multi-language.txt
Si la requête aboutit, le serveur renvoie un code d'état HTTP 200 OK
et la réponse au format JSON, enregistrée dans un fichier nommé multi-language.txt
.
{ "results": [ { "alternatives": [ { "transcript": "hi I'd like to buy a Chromecast I'm ..." "confidence": 0.9466864 } ], "languageCode": "en-us" }, { "alternatives": [ { "transcript": " let's go with the black one", "confidence": 0.9829583 } ], "languageCode": "en-us" }, ] }
Java
Pour savoir comment installer et utiliser la bibliothèque cliente pour Speech-to-Text, consultez la page Bibliothèques clientes Speech-to-Text. Pour en savoir plus, consultez la documentation de référence de l'API Speech-to-Text en langage Java.
Pour vous authentifier auprès de Speech-to-Text, configurez le service Identifiants par défaut de l'application. Pour en savoir plus, consultez Configurer l'authentification pour un environnement de développement local.
Node.js
Pour savoir comment installer et utiliser la bibliothèque cliente pour Speech-to-Text, consultez la page Bibliothèques clientes Speech-to-Text. Pour en savoir plus, consultez la documentation de référence de l'API Speech-to-Text en langage Node.js.
Pour vous authentifier auprès de Speech-to-Text, configurez le service Identifiants par défaut de l'application. Pour en savoir plus, consultez Configurer l'authentification pour un environnement de développement local.
Python
Pour savoir comment installer et utiliser la bibliothèque cliente pour Speech-to-Text, consultez la page Bibliothèques clientes Speech-to-Text. Pour en savoir plus, consultez la documentation de référence de l'API Speech-to-Text en langage Python.
Pour vous authentifier auprès de Speech-to-Text, configurez le service Identifiants par défaut de l'application. Pour en savoir plus, consultez Configurer l'authentification pour un environnement de développement local.
Utiliser un fichier distant
Java
Pour savoir comment installer et utiliser la bibliothèque cliente pour Speech-to-Text, consultez la page Bibliothèques clientes Speech-to-Text. Pour en savoir plus, consultez la documentation de référence de l'API Speech-to-Text en langage Java.
Pour vous authentifier auprès de Speech-to-Text, configurez le service Identifiants par défaut de l'application. Pour en savoir plus, consultez Configurer l'authentification pour un environnement de développement local.
Node.js
Pour savoir comment installer et utiliser la bibliothèque cliente pour Speech-to-Text, consultez la page Bibliothèques clientes Speech-to-Text. Pour en savoir plus, consultez la documentation de référence de l'API Speech-to-Text en langage Node.js.
Pour vous authentifier auprès de Speech-to-Text, configurez le service Identifiants par défaut de l'application. Pour en savoir plus, consultez Configurer l'authentification pour un environnement de développement local.
Python
Pour savoir comment installer et utiliser la bibliothèque cliente pour Speech-to-Text, consultez la page Bibliothèques clientes Speech-to-Text. Pour en savoir plus, consultez la documentation de référence de l'API Speech-to-Text en langage Python.
Pour vous authentifier auprès de Speech-to-Text, configurez le service Identifiants par défaut de l'application. Pour en savoir plus, consultez Configurer l'authentification pour un environnement de développement local.