Créer du contenu audio à partir de texte à l'aide de la ligne de commande

Ce document vous explique comment envoyer une requête à Text-to-Speech à l'aide de la ligne de commande. Pour en savoir plus sur les concepts fondamentaux de Text-to-Speech, consultez la page Concepts de base de Text-to-Speech.

Avant de commencer

Avant de pouvoir envoyer une requête à l'API Text-to-Speech, vous devez avoir effectué les actions suivantes. Pour en savoir plus, consultez la page Avant de commencer.

Activez Text-to-Speech sur un projet GCP.
Vérifiez que la facturation est activée pour Text-to-Speech.
After installing the Google Cloud CLI, configure the gcloud CLI to use your federated identity and then initialize it by running the following command:
```
gcloud init
```

Synthétiser des contenus audio à partir de texte

Pour convertir du texte en contenus audio, envoyez une requête HTTP POST au point de terminaison https://texttospeech.googleapis.com/v1/text:synthesize. Dans le corps de la commande POST, spécifiez le type de voix à synthétiser dans la section de configuration voice, le texte à synthétiser dans le champ text de la section input et le type de contenus audio à créer dans la section audioConfig.

Exécutez la requête REST ci-dessous sur la ligne de commande pour synthétiser des contenus audio à partir d'un texte à l'aide de Text-to-Speech. La commande récupère un jeton d'autorisation pour la requête à l'aide de gcloud auth application-default print-access-token.

Avant d'utiliser les données de requête, effectuez les remplacements suivants :
- PROJECT_ID : ID alphanumérique de votre projet Google Cloud.
Méthode HTTP et URL :
```
POST https://texttospeech.googleapis.com/v1/text:synthesize
```
Corps JSON de la requête :
```
{
  "input": {
    "text": "Android is a mobile operating system developed by Google, based on the Linux kernel and designed primarily for touchscreen mobile devices such as smartphones and tablets."
  },
  "voice": {
    "languageCode": "en-gb",
    "name": "en-GB-Standard-A",
    "ssmlGender": "FEMALE"
  },
  "audioConfig": {
    "audioEncoding": "MP3"
  }
}
```
Pour envoyer votre requête, développez l'une des options suivantes :
curl (Linux, macOS ou Cloud Shell)

Remarque : La commande suivante suppose que vous êtes connecté à la CLI gcloud avec votre compte utilisateur en exécutant la commande gcloud init ou gcloud auth login, ou en utilisant Cloud Shell, qui vous connecte automatiquement à la CLI gcloud. Vous pouvez exécuter la commande gcloud auth list pour vérifier quel est le compte actuellement actif.

Enregistrez le corps de la requête dans un fichier nommé request.json, puis exécutez la commande suivante :
```
curl -X POST \
     -H "Authorization: Bearer $(gcloud auth print-access-token)" \
     -H "x-goog-user-project: PROJECT_ID" \
     -H "Content-Type: application/json; charset=utf-8" \
     -d @request.json \
     "https://texttospeech.googleapis.com/v1/text:synthesize"
```
PowerShell (Windows)

Remarque : La commande suivante suppose que vous vous êtes connecté à la CLI gcloud avec votre compte utilisateur en exécutant la commande gcloud init ou gcloud auth login. Vous pouvez exécuter la commande gcloud auth list pour vérifier quel est le compte actuellement actif.

Enregistrez le corps de la requête dans un fichier nommé request.json, puis exécutez la commande suivante :
```
$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred"; "x-goog-user-project" = "PROJECT_ID" }

Invoke-WebRequest `
    -Method POST `
    -Headers $headers `
    -ContentType: "application/json; charset=utf-8" `
    -InFile request.json `
    -Uri "https://texttospeech.googleapis.com/v1/text:synthesize" | Select-Object -Expand Content
```
Vous devriez recevoir une réponse JSON de ce type :
```
{
  "audioContent": "//NExAASCCIIAAhEAGAAEMW4kAYPnwwIKw/BBTpwTvB+IAxIfghUfW.."
}
```
Le résultat JSON de la commande REST contient l'audio synthétisé encodé en base64. Copiez le contenu du champ audioContent dans un nouveau fichier nommé synthesize-output-base64.txt. Ce fichier ressemblera à ceci :
```
//NExAARqoIIAAhEuWAAAGNmBGMY4EBcxvABAXBPmPIAF//yAuh9Tn5CEap3/o
...
VVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVVV
```
Décodez les contenus du fichier synthesize-output-base64.txt dans un nouveau fichier nommé synthesized-audio.mp3. Pour plus d'informations sur le décodage des données base64, consultez la page Décoder les contenus audio encodés en base64.
Linux
1. Ne copiez que le contenu encodé en base64 dans un fichier texte.
2. Décodez le fichier texte source à l'aide de l'outil de ligne de commande base64 avec l'indicateur -d :
```
    $ base64 SOURCE_BASE64_TEXT_FILE -d > DESTINATION_AUDIO_FILE
```
macOS
1. Ne copiez que le contenu encodé en base64 dans un fichier texte.
2. Décodez le fichier texte source à l'aide de l'outil de ligne de commande base64 :
```
    $ base64 --decode SOURCE_BASE64_TEXT_FILE > DESTINATION_AUDIO_FILE
```
Windows
1. Ne copiez que le contenu encodé en base64 dans un fichier texte.
2. Décodez le fichier texte source à l'aide de la commande certutil.
```
   certutil -decode SOURCE_BASE64_TEXT_FILE DESTINATION_AUDIO_FILE
```
Lisez les contenus du fichier synthesized-audio.mp3 dans une application audio ou sur un appareil audio. Vous pouvez également ouvrir le fichier synthesized-audio.mp3 dans le navigateur Chrome pour lire l'audio. Pour de faire, accédez au dossier qui contient le fichier, par exemple file://my_file_path/synthesized-audio.mp3.

Effectuer un nettoyage

Pour éviter d'encourir des frais inutiles liés à Google Cloud Platform, supprimez votre projet à l'aide de Google Cloud Console si vous n'en avez plus besoin.

Étape suivante

Pour en savoir plus sur Cloud Text-to-Speech, consultez la page Concepts de base.
Passez en revue la liste des voix disponibles que vous pouvez utiliser pour la voix synthétique.

Créer du contenu audio à partir de texte à l'aide de la ligne de commande

Avant de commencer

Synthétiser des contenus audio à partir de texte

curl (Linux, macOS ou Cloud Shell)

PowerShell (Windows)

Linux

macOS

Windows

Effectuer un nettoyage

Étape suivante