Démarrage rapide : Utiliser la ligne de commande

Ce guide de démarrage rapide vous présente Text-to-Speech. Dans ce guide de démarrage rapide, vous allez configurer votre projet Google Cloud Platform et obtenir les autorisations requises. Vous demanderez ensuite à Text-to-Speech de créer des contenus audio à partir de texte.

Pour en savoir plus sur les concepts fondamentaux de Text-to-Speech, consultez la page Concepts de base de Text-to-Speech.

Avant de commencer

  1. Connectez-vous à votre compte Google Cloud. Si vous débutez sur Google Cloud, créez un compte pour évaluer les performances de nos produits en conditions réelles. Les nouveaux clients bénéficient également de 300 $ de crédits gratuits pour exécuter, tester et déployer des charges de travail.
  2. Dans Google Cloud Console, sur la page de sélection du projet, sélectionnez ou créez un projet Google Cloud.

    Accéder au sélecteur de projet

  3. Assurez-vous que la facturation est activée pour votre projet Cloud. Découvrez comment vérifier que la facturation est activée pour votre projet.

  4. Activez l'API Cloud Text-to-Speech.

    Activer l'API

  5. Créez un compte de service :

    1. Dans Cloud Console, accédez à la page Créer un compte de service.

      Accéder à la page "Créer un compte de service"
    2. Sélectionnez un projet.
    3. Dans le champ Nom du compte de service, saisissez un nom. Cloud Console remplit le champ ID du compte de service en fonction de ce nom.

      Dans le champ Description du compte de service, saisissez une description. Exemple : Service account for quickstart.

    4. Cliquez sur OK pour terminer la création du compte de service.

      Ne fermez pas la fenêtre de votre navigateur. Vous en aurez besoin lors de la tâche suivante.

  6. Créez une clé de compte de service :

    1. Dans Cloud Console, cliquez sur l'adresse e-mail du compte de service que vous avez créé.
    2. Cliquez sur Clés.
    3. Cliquez sur Ajouter une clé, puis sur Créer une clé.
    4. Cliquez sur Create (Créer). Un fichier de clé JSON est téléchargé sur votre ordinateur.
    5. Cliquez sur Close (Fermer).
  7. Définissez la variable d'environnement GOOGLE_APPLICATION_CREDENTIALS pour qu'elle pointe vers le chemin du fichier JSON contenant la clé de votre compte de service. Cette variable ne s'applique qu'à la session de shell actuelle. Par conséquent, si vous ouvrez une nouvelle session, vous devez de nouveau la définir.

  8. Installez et initialisez le SDK Cloud.

Synthétiser des contenus audio à partir de texte

Pour convertir du texte en contenus audio, envoyez une requête HTTP POST au point de terminaison https://texttospeech.googleapis.com/v1/text:synthesize. Dans le corps de la commande POST, spécifiez le type de voix à synthétiser dans la section de configuration voice, le texte à synthétiser dans le champ text de la section input et le type de contenus audio à créer dans la section audioConfig.

  1. Exécutez la requête REST ci-dessous sur la ligne de commande pour synthétiser des contenus audio à partir d'un texte à l'aide de Text-to-Speech. La commande récupère un jeton d'autorisation pour la requête à l'aide de gcloud auth application-default print-access-token.

    Méthode HTTP et URL :

    POST https://texttospeech.googleapis.com/v1/text:synthesize

    Corps JSON de la requête :

    {
      "input":{
        "text":"Android is a mobile operating system developed by Google, based on the Linux kernel and designed primarily for touchscreen mobile devices such as smartphones and tablets."
      },
      "voice":{
        "languageCode":"en-gb",
        "name":"en-GB-Standard-A",
        "ssmlGender":"FEMALE"
      },
      "audioConfig":{
        "audioEncoding":"MP3"
      }
    }
    

    Pour envoyer votre requête, développez l'une des options suivantes :

    Vous devriez recevoir une réponse JSON de ce type :

    {
      "audioContent": "//NExAASCCIIAAhEAGAAEMW4kAYPnwwIKw/BBTpwTvB+IAxIfghUfW.."
    }
    

  2. Le résultat JSON de la commande REST contient l'audio synthétisé encodé en base64. Copiez le contenu du champ audioContent dans un nouveau fichier nommé synthesize-output-base64.txt. Ce fichier ressemblera à ceci :

    //NExAARqoIIAAhEuWAAAGNmBGMY4EBcxvABAXBPmPIAF//yAuh9Tn5CEap3/o
    ...
    VVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVV
    
  3. Décodez les contenus du fichier synthesize-output-base64.txt dans un nouveau fichier nommé synthesized-audio.mp3. Pour plus d'informations sur le décodage des données base64, consultez la page Décoder les contenus audio encodés en base64.

    Linux

    1. Ne copiez que le contenu encodé en base64 dans un fichier texte.

    2. Décodez le fichier texte source à l'aide de l'outil de ligne de commande base64 avec l'indicateur -d :

        $ base64 SOURCE_BASE64_TEXT_FILE -d > DESTINATION_AUDIO_FILE
    

    macOS

    1. Ne copiez que le contenu encodé en base64 dans un fichier texte.

    2. Décodez le fichier texte source à l'aide de l'outil de ligne de commande base64 :

        $ base64 --decode SOURCE_BASE64_TEXT_FILE > DESTINATION_AUDIO_FILE
    

    Windows

    1. Ne copiez que le contenu encodé en base64 dans un fichier texte.

    2. Décodez le fichier texte source à l'aide de la commande certutil.

       certutil -decode SOURCE_BASE64_TEXT_FILE DESTINATION_AUDIO_FILE
    
  4. Lisez les contenus du fichier synthesized-audio.mp3 dans une application audio ou sur un appareil audio. Vous pouvez également ouvrir le fichier synthesized-audio.mp3 dans le navigateur Chrome pour lire l'audio. Pour de faire, accédez au dossier qui contient le fichier, par exemple file://my_file_path/synthesized-audio.mp3.

Nettoyer

Pour éviter d'encourir des frais inutiles liés à Google Cloud Platform, supprimez votre projet à l'aide de Cloud Console si vous n'en avez plus besoin.

Étape suivante

  • Pour en savoir plus sur Cloud Text-to-Speech, consultez la page Concepts de base.
  • Passez en revue la liste des voix disponibles que vous pouvez utiliser pour la voix synthétique.