Transcrire la voix en texte à l'aide de la CLI gcloud
Cette page explique comment envoyer une requête de reconnaissance vocale à Speech-to-Text avec l'outil gcloud
depuis la ligne de commande.
Speech-to-Text permet d'intégrer facilement les technologies de reconnaissance vocale Google aux applications en cours de développement. Vous pouvez envoyer des données audio à l'API Speech-to-Text, qui renvoie ensuite une transcription de ce fichier audio en texte. Pour plus d'informations sur le service, consultez la page Principes de base de Speech-to-Text.
Avant de commencer
Avant de pouvoir envoyer une requête à l'API Speech-to-Text, vous devez avoir effectué les actions suivantes. Pour en savoir plus, consultez la page Avant de commencer.
- Activez Speech-to-Text sur un projet GCP.
- Assurez-vous que la facturation est activée pour Speech-to-Text.
- Créez et/ou attribuez un ou plusieurs comptes de service à Speech-to-Text.
- Téléchargez une clé d'identifiants de compte de service.
- Définissez la variable d'environnement d'authentification.
- (Facultatif) Créez un bucket Google Cloud Storage pour stocker vos données audio.
Envoyer une requête de transcription audio
Speech-to-Text vous permet désormais de transcrire un fichier audio en texte. Servez-vous de l'exemple de code suivant pour envoyer une requête recognize
à l'API Speech-to-Text.
Ouvrez l'interface système, puis exécutez la commande suivante :
gcloud ml speech recognize gs://cloud-samples-tests/speech/brooklyn.flac \ --language-code=en-US
Cette commande demande à Speech-to-Text de transcrire le contenu audio d'un fichier FLAC hébergé sur un emplacement accessible publiquement.
Si la requête aboutit, le serveur renvoie une réponse au format JSON :
{ "results": [ { "alternatives": [ { "confidence": 0.9840146, "transcript": "how old is the Brooklyn Bridge" } ] } ] }
Félicitations ! Vous venez d'envoyer votre première requête à Speech-to-Text.
Si vous recevez un message d'erreur ou une réponse vide de Speech-to-Text, reportez-vous aux procédures de dépannage et de réduction des erreurs.
Effectuer un nettoyage
Pour éviter que les ressources utilisées sur cette page soient facturées sur votre compte Google Cloud :
Étape suivante
- Entraînez-vous à transcrire des fichiers audio courts.
- Découvrez comment traiter des fichiers audio longs par lot pour la reconnaissance vocale.
- Découvrez comment transcrire du contenu audio diffusé en streaming, à partir d'un micro par exemple.
- Faites vos premiers pas avec Speech-to-Text dans le langage de votre choix à l'aide de l'une des bibliothèques clientes Speech-to-Text.
- Parcourez les exemples d'applications.
- Pour obtenir des conseils, entre autres sur l'optimisation des performances et l'amélioration de la précision, consultez la documentation relative aux bonnes pratiques.