Transcrire la voix en texte en texte à l'aide de bibliothèques clientes
Cette page explique comment envoyer une requête de reconnaissance vocale à Speech-to-Text dans votre langage de programmation favori à l'aide des bibliothèques clientes Google Cloud.
Speech-to-Text permet d'intégrer facilement les technologies de reconnaissance vocale Google aux applications en cours de développement. Vous pouvez envoyer des données audio à l'API Speech-to-Text, qui renvoie ensuite une transcription de ce fichier audio en texte. Pour plus d'informations sur le service, consultez la page Principes de base de Speech-to-Text.
Avant de commencer
Avant de pouvoir envoyer une requête à l'API Speech-to-Text, vous devez avoir effectué les actions suivantes. Pour en savoir plus, consultez la page Avant de commencer.
- Activez Speech-to-Text dans un projet Google Cloud.
- Assurez-vous que la facturation est activée pour Speech-to-Text.
- Créez et/ou attribuez un ou plusieurs comptes de service à Speech-to-Text.
- Téléchargez une clé d'identifiants de compte de service.
- Définissez la variable d'environnement d'authentification.
- (Facultatif) Créez un bucket Google Cloud Storage pour stocker vos données audio.
Installer la bibliothèque cliente
Go
go get cloud.google.com/go/speech/apiv1
Java
Si vous utilisez Maven, ajoutez les lignes suivantes à votre fichier pom.xml
. Pour en savoir plus sur les BOM, consultez la page The Google Cloud Platform Libraries BOM (BOM des bibliothèques Google Cloud Platform).
Si vous utilisez Gradle, ajoutez les éléments suivants à vos dépendances :
Si vous utilisez sbt, ajoutez les éléments suivants à vos dépendances :
Si vous utilisez Visual Studio Code, IntelliJ ou Eclipse, vous pouvez ajouter des bibliothèques clientes à votre projet à l'aide des plug-ins IDE suivants :
Les plug-ins offrent des fonctionnalités supplémentaires, telles que la gestion des clés pour les comptes de service. Reportez-vous à la documentation de chaque plug-in pour plus de détails.
Node.js
Avant d'installer la bibliothèque, assurez-vous d'avoir préparé votre environnement pour le développement Node.js.
npm install --save @google-cloud/speech
Python
Avant d'installer la bibliothèque, assurez-vous d'avoir préparé votre environnement pour le développement Python.
pip install --upgrade google-cloud-speech
Envoyer une requête de transcription audio
Speech-to-Text vous permet désormais de transcrire un fichier audio en texte. Servez-vous de l'exemple de code suivant pour envoyer une requête recognize
à l'API Speech-to-Text.
Go
Java
Node.js
Avant d'exécuter l'exemple, assurez-vous d'avoir préparé l'environnement pour le développement Node.js.
Python
Avant d'exécuter l'exemple, assurez-vous d'avoir préparé l'environnement pour le développement Python.
Félicitations ! Vous venez d'envoyer votre première requête à Speech-to-Text.
Si vous recevez un message d'erreur ou une réponse vide de Speech-to-Text, reportez-vous aux procédures de dépannage et de réduction des erreurs.
Effectuer un nettoyage
Pour éviter que les ressources utilisées sur cette page soient facturées sur votre compte Google Cloud, procédez comme suit :
- Utilisez la console Google Cloud pour supprimer votre projet, si vous n'en avez plus besoin.
Étape suivante
- Entraînez-vous à transcrire des fichiers audio courts.
- Découvrez comment traiter des fichiers audio longs par lot pour la reconnaissance vocale.
- Découvrez comment transcrire du contenu audio diffusé en streaming, à partir d'un micro par exemple.
- Faites vos premiers pas avec Speech-to-Text dans le langage de votre choix à l'aide de l'une des bibliothèques clientes Speech-to-Text.
- Parcourez les exemples d'applications.
- Pour obtenir des conseils, entre autres sur l'optimisation des performances et l'amélioration de la précision, consultez la documentation relative aux bonnes pratiques.