Les données audio sont des données binaires. Vous pouvez les lire directement à partir d'une réponse gRPC. Cependant, le format JSON est utilisé dans la réponse à une requête REST. Comme il s'agit d'un format de texte qui n'est pas directement compatible avec les données binaires, Text-to-Speech renvoie une chaîne de réponse encodée en Base64. Vous devez convertir les données texte encodées en base64 de la réponse en données binaires pour pouvoir les lire sur un appareil.
Les réponses JSON de Text-to-Speech incluent du contenu audio encodé en base64 dans le champ audioContent
. Exemple :
{ "audioContent": "//NExAARqoIIAAhEuWAAAGNmBGMY4EBcxvABAXBPmPIAF//yAuh9Tn5CEap3/o..." }
Pour décoder du contenu base64 en fichier audio :
Linux
Ne copiez que le contenu encodé en base64 dans un fichier texte.
Décodez le fichier texte source à l'aide de l'outil de ligne de commande base64 avec l'indicateur
-d
:
$ base64 SOURCE_BASE64_TEXT_FILE -d > DESTINATION_AUDIO_FILE
macOS
Ne copiez que le contenu encodé en base64 dans un fichier texte.
Décodez le fichier texte source à l'aide de l'outil de ligne de commande base64 :
$ base64 --decode -i SOURCE_BASE64_TEXT_FILE > DESTINATION_AUDIO_FILE
Windows
Ne copiez que le contenu encodé en base64 dans un fichier texte.
Décodez le fichier texte source à l'aide de la commande
certutil
.
certutil -decode SOURCE_BASE64_TEXT_FILE DESTINATION_AUDIO_FILE