Cette page explique comment insérer automatiquement la ponctuation dans les résultats de transcription obtenus de Speech-to-Text. Lorsque vous activez cette fonctionnalité, Speech-to-Text infère automatiquement la présence des points, des virgules et des points d'interrogation dans vos données audio et les ajoute à la transcription.
Par défaut, Speech-to-Text n'inclut pas les signes de ponctuation dans les résultats de reconnaissance vocale. Cependant, vous pouvez lui demander de détecter et d'insérer automatiquement la ponctuation dans les résultats de transcription. Lorsque vous activez la ponctuation automatique, Speech-to-Text met également automatiquement en majuscule les lettres qui suivent immédiatement les points et les points d'interrogation.
Pour activer la ponctuation automatique, définissez le champ enableAutomaticPunctuation
sur la valeur true
dans les paramètres RecognitionConfig
correspondant à la requête. La ponctuation automatique est disponible avec l'API Speech-to-Text pour toutes les méthodes de reconnaissance vocale : speech:recognize
, speech:longrunningrecognize
et Streaming.
Les exemples de code ci-dessous montrent comment configurer une requête de transcription pour insérer automatiquement les signes de ponctuation.
Protocole
Reportez-vous au point de terminaisonspeech:recognize
de l'API pour obtenir des informations complètes.
Pour réaliser une reconnaissance vocale synchrone, exécutez une requête POST
en fournissant le corps de requête approprié. Voici un exemple de requête POST
utilisant curl
. L'exemple utilise Google Cloud CLI pour générer un jeton d'accès. Pour obtenir des instructions sur l'installation de gcloud CLI, consultez le guide de démarrage rapide.
curl -s -H "Content-Type: application/json" \ -H "Authorization: Bearer "$(gcloud auth print-access-token) \ https://speech.googleapis.com/v1/speech:recognize \ --data '{ "config": { "encoding":"FLAC", "sampleRateHertz": 16000, "languageCode": "en-US", "enableAutomaticPunctuation": true }, "audio": { "uri":"gs://cloud-samples-tests/speech/brooklyn.flac" } }'
Pour en savoir plus sur la configuration du corps de la requête, consultez la documentation de référence sur RecognitionConfig
.
Si la requête aboutit, le serveur renvoie un code d'état HTTP 200 OK
ainsi que la réponse au format JSON :
{ "results": [ { "alternatives": [ { "transcript": "How old is the Brooklyn Bridge?", "confidence": 0.98360395 } ] } ] }
Go
Pour savoir comment installer et utiliser la bibliothèque cliente pour Speech-to-Text, consultez la page Bibliothèques clientes Speech-to-Text. Pour en savoir plus, consultez la documentation de référence de l'API Speech-to-Text en langage Go.
Pour vous authentifier auprès de Speech-to-Text, configurez le service Identifiants par défaut de l'application. Pour en savoir plus, consultez Configurer l'authentification pour un environnement de développement local.
Java
Pour savoir comment installer et utiliser la bibliothèque cliente pour Speech-to-Text, consultez la page Bibliothèques clientes Speech-to-Text. Pour en savoir plus, consultez la documentation de référence de l'API Speech-to-Text en langage Java.
Pour vous authentifier auprès de Speech-to-Text, configurez le service Identifiants par défaut de l'application. Pour en savoir plus, consultez Configurer l'authentification pour un environnement de développement local.
Node.js
Pour savoir comment installer et utiliser la bibliothèque cliente pour Speech-to-Text, consultez la page Bibliothèques clientes Speech-to-Text. Pour en savoir plus, consultez la documentation de référence de l'API Speech-to-Text en langage Node.js.
Pour vous authentifier auprès de Speech-to-Text, configurez le service Identifiants par défaut de l'application. Pour en savoir plus, consultez Configurer l'authentification pour un environnement de développement local.
Python
Pour savoir comment installer et utiliser la bibliothèque cliente pour Speech-to-Text, consultez la page Bibliothèques clientes Speech-to-Text. Pour en savoir plus, consultez la documentation de référence de l'API Speech-to-Text en langage Python.
Pour vous authentifier auprès de Speech-to-Text, configurez le service Identifiants par défaut de l'application. Pour en savoir plus, consultez Configurer l'authentification pour un environnement de développement local.
Langages supplémentaires
C# : Veuillez suivre les Instructions de configuration pour C# sur la page des bibliothèques clientes, puis consultez la page Documentation de référence sur Speech-to-Text pour .NET.
PHP : Veuillez suivre les Instructions de configuration pour PHP sur la page des bibliothèques clientes, puis consultez la page Documentation de référence sur Speech-to-Text pour PHP.
Ruby : Veuillez suivre les Instructions de configuration pour Ruby sur la page des bibliothèques clientes, puis consultez la Documentation de référence sur Speech-to-Text pour Ruby.
Étape suivante
Consultez la procédure à suivre pour envoyer des requêtes de transcription synchrones.