Les données audio sont des données binaires. Vous pouvez les lire directement à partir d'une réponse gRPC. Cependant, le format JSON est utilisé dans la réponse à une requête REST. Comme il s'agit d'un format de texte qui n'est pas directement compatible avec les données binaires, Text-to-Speech renvoie une chaîne de réponse encodée en Base64. Vous devez convertir les données texte encodées en base64 de la réponse en données binaires pour pouvoir les lire sur un appareil.
Les réponses JSON de Text-to-Speech incluent du contenu audio encodé en base64 dans le champ audioContent
. Exemple :
{ "audioContent": "//NExAARqoIIAAhEuWAAAGNmBGMY4EBcxvABAXBPmPIAF//yAuh9Tn5CEap3/o... " }
Pour décoder du contenu base64 en fichier audio :
Ne copiez que le contenu encodé en base64 dans un fichier texte.
Décodez le fichier texte source à l'aide de l'outil de ligne de commande base64 avec l'indicateur
-d
:
$ base64SOURCE_BASE64_TEXT_FILE -d >DESTINATION_AUDIO_FILE
Ne copiez que le contenu encodé en base64 dans un fichier texte.
Décodez le fichier texte source à l'aide de l'outil de ligne de commande base64 :
$ base64 --decode -iSOURCE_BASE64_TEXT_FILE >DESTINATION_AUDIO_FILE
Ne copiez que le contenu encodé en base64 dans un fichier texte.
Décodez le fichier texte source à l'aide de la commande
certutil
.
certutil -decodeSOURCE_BASE64_TEXT_FILE DESTINATION_AUDIO_FILE