Transcrire la voix en texte à l'aide de la ligne de commande

Cette page explique comment envoyer une requête de reconnaissance vocale à Speech-to-Text à l'aide de l'interface REST et de la commande curl.

Speech-to-Text permet d'intégrer facilement les technologies de reconnaissance vocale Google aux applications en cours de développement. Vous pouvez envoyer des données audio à l'API Speech-to-Text, qui renvoie ensuite une transcription de ce fichier audio en texte. Pour plus d'informations sur le service, consultez la page Principes de base de Speech-to-Text.

Avant de commencer

  1. Connectez-vous à votre compte Google Cloud. Si vous débutez sur Google Cloud, créez un compte pour évaluer les performances de nos produits en conditions réelles. Les nouveaux clients bénéficient également de 300 $ de crédits gratuits pour exécuter, tester et déployer des charges de travail.
  2. Dans Google Cloud Console, sur la page de sélection du projet, sélectionnez ou créez un projet Google Cloud.

    Accéder au sélecteur de projet

  3. Vérifiez que la facturation est activée pour votre projet Google Cloud.

  4. Activer les API Speech-to-Text.

    Activer les API

  5. Assurez-vous que vous disposez du ou des rôles suivants au niveau du projet : Cloud Speech Administrator

    Vérifier les rôles

    1. Dans la console Google Cloud, accédez à la page IAM.

      Accéder à IAM
    2. Sélectionnez le projet.
    3. Dans la colonne Compte principal, recherchez la ligne qui contient votre adresse e-mail.

      Si votre adresse e-mail ne figure pas dans cette colonne, cela signifie que vous n'avez aucun rôle.

    4. Dans la colonne Rôle de la ligne contenant votre adresse e-mail, vérifiez si la liste des rôles inclut les rôles requis.

    Attribuer les rôles

    1. Dans la console Google Cloud, accédez à la page IAM.

      Accéder à IAM
    2. Sélectionnez le projet.
    3. Cliquez sur Accorder l'accès.
    4. Dans le champ Nouveaux comptes principaux, saisissez votre adresse e-mail.
    5. Dans la liste Sélectinoner un rôle, sélectionnez un rôle.
    6. Pour attribuer des rôles supplémentaires, cliquez sur Ajouter un autre rôle et ajoutez chaque rôle supplémentaire.
    7. Cliquez sur Enregistrer.
  6. Installez Google Cloud CLI.
  7. Pour initialiser gcloudCLI, exécutez la commande suivante :

    gcloud init
  8. Dans Google Cloud Console, sur la page de sélection du projet, sélectionnez ou créez un projet Google Cloud.

    Accéder au sélecteur de projet

  9. Vérifiez que la facturation est activée pour votre projet Google Cloud.

  10. Activer les API Speech-to-Text.

    Activer les API

  11. Assurez-vous que vous disposez du ou des rôles suivants au niveau du projet : Cloud Speech Administrator

    Vérifier les rôles

    1. Dans la console Google Cloud, accédez à la page IAM.

      Accéder à IAM
    2. Sélectionnez le projet.
    3. Dans la colonne Compte principal, recherchez la ligne qui contient votre adresse e-mail.

      Si votre adresse e-mail ne figure pas dans cette colonne, cela signifie que vous n'avez aucun rôle.

    4. Dans la colonne Rôle de la ligne contenant votre adresse e-mail, vérifiez si la liste des rôles inclut les rôles requis.

    Attribuer les rôles

    1. Dans la console Google Cloud, accédez à la page IAM.

      Accéder à IAM
    2. Sélectionnez le projet.
    3. Cliquez sur Accorder l'accès.
    4. Dans le champ Nouveaux comptes principaux, saisissez votre adresse e-mail.
    5. Dans la liste Sélectinoner un rôle, sélectionnez un rôle.
    6. Pour attribuer des rôles supplémentaires, cliquez sur Ajouter un autre rôle et ajoutez chaque rôle supplémentaire.
    7. Cliquez sur Enregistrer.
  12. Installez Google Cloud CLI.
  13. Pour initialiser gcloudCLI, exécutez la commande suivante :

    gcloud init

Envoyer une requête de transcription audio

Servez-vous de l'exemple de code suivant pour envoyer une requête REST recognize à l'API Speech-to-Text.

  1. Exécutez cette commande pour créer un fichier JSON en tant qu'entrée de la requête. Remplacez /full/path/to/audio/file.wav par le chemin d'accès au fichier audio que vous souhaitez transcrire :

    echo "{
      \"config\": {
        \"auto_decoding_config\": {},
        \"language_codes\": [\"en-US\"],
        \"model\": \"long\"
      },
      \"content\": \"$(base64 -w 0 /full/path/to/audio/file.wav | sed 's/+/-/g; s/\//_/g')\"
    }" > /tmp/data.txt
    
  2. Utilisez curl pour effectuer une requête recognize :

    curl -X POST -H "Content-Type: application/json; charset=utf-8" \
        -H "Authorization: Bearer $(gcloud auth print-access-token)" \
        -d @/tmp/data.txt \
        https://speech.googleapis.com/v2/projects/PROJECT_ID/locations/global/recognizers/_:recognize
    

    Un résultat semblable aux lignes suivantes doit s'afficher :

      {
        "results": [
          {
            "alternatives": [
              {
                "transcript": "how old is the Brooklyn Bridge",
                "confidence": 0.98267895
              }
            ]
          }
        ]
      }
    

Vous avez envoyé votre première requête à Speech-to-Text.

Effectuer un nettoyage

Pour éviter que les ressources utilisées sur cette page soient facturées sur votre compte Google Cloud, suivez les étapes ci-dessous :

  1. Facultatif : Révoquez les identifiants d'authentification que vous avez créés et supprimez le fichier d'identifiants local.

    gcloud auth application-default revoke
  2. Facultatif : Révoquez les identifiants de la CLI gcloud.

    gcloud auth revoke

Console

  • Dans la console Google Cloud, accédez à la page Gérer les ressources.

    Accéder à la page Gérer les ressources

  • Dans la liste des projets, sélectionnez le projet que vous souhaitez supprimer, puis cliquez sur Supprimer.
  • Dans la boîte de dialogue, saisissez l'ID du projet, puis cliquez sur Arrêter pour supprimer le projet.
  • gcloud

    Supprimez un projet Google Cloud :

    gcloud projects delete PROJECT_ID

    Étapes suivantes