Cette page a été traduite par l'API Cloud Translation.
Switch to English

Démarrage rapide : Utiliser l'outil gcloud

Cette page explique comment envoyer une requête de reconnaissance vocale à Speech-to-Text avec l'outil gcloud depuis la ligne de commande.

Speech-to-Text permet d'intégrer facilement les technologies de reconnaissance vocale Google aux applications en cours de développement. Vous pouvez envoyer des données audio à l'API Speech-to-Text, qui renvoie ensuite une transcription de ce fichier audio en texte. Pour plus d'informations sur le service, consultez la page Principes de base de Speech-to-Text.

Avant de commencer

  1. Connectez-vous à votre compte Google.

    Si vous n'en possédez pas déjà un, vous devez en créer un.

  2. Configurez un projet Cloud Console.

    Configurer un projet

    Cliquez pour effectuer les opérations suivantes :

    • Créer ou sélectionner un projet
    • Activez l'API Speech-to-Text pour ce projet.
    • Créez un compte de service.
    • Téléchargez une clé privée au format JSON.

    Vous pouvez consulter et gérer ces ressources à tout moment dans Cloud Console.

  3. Définissez la variable d'environnement GOOGLE_APPLICATION_CREDENTIALS pour qu'elle pointe vers le chemin du fichier JSON contenant la clé de votre compte de service. Cette variable ne s'applique qu'à la session de shell actuelle. Par conséquent, si vous ouvrez une nouvelle session, vous devez de nouveau la définir.

  4. Installez et initialisez le SDK Cloud.

Envoyer une requête de transcription audio

Speech-to-Text vous permet désormais de transcrire un fichier audio en texte. Servez-vous de l'exemple de code suivant pour envoyer une requête recognize à l'API Speech-to-Text.

Ouvrez l'interface système, puis exécutez la commande suivante :

gcloud ml speech recognize gs://cloud-samples-tests/speech/brooklyn.flac \
    --language-code=en-US

Cette commande demande à Speech-to-Text de transcrire le contenu audio d'un fichier FLAC hébergé sur un emplacement accessible publiquement.

Si la requête aboutit, le serveur renvoie une réponse au format JSON :

{
  "results": [
    {
      "alternatives": [
        {
          "confidence": 0.9840146,
          "transcript": "how old is the Brooklyn Bridge"
        }
      ]
    }
  ]
}

Félicitations ! Vous venez d'envoyer votre première requête à Speech-to-Text.

Si vous recevez un message d'erreur ou une réponse vide de Speech-to-Text, reportez-vous aux procédures de dépannage et de réduction des erreurs.

Étapes suivantes