Audiodaten sind binäre Daten. Sie können die Binärdaten direkt aus einer gRPC-Antwort lesen. Bei der Beantwortung einer REST-Anfrage wird jedoch JSON verwendet. JSON ist ein Textformat, das Binärdaten nicht direkt unterstützt, sodass Text-to-Speech einen Base64-codierten Antwortstring zurückgibt. Sie müssen die Base64-codierten Textdaten der Antwort vor der Wiedergabe auf einem Gerät in das Binärformat umwandeln.
JSON-Antworten von Text-to-Speech enthalten im Feld audioContent Base64-codierten Audioinhalt. Beispiel:
{
  "audioContent": "//NExAARqoIIAAhEuWAAAGNmBGMY4EBcxvABAXBPmPIAF//yAuh9Tn5CEap3/o..."
}
So decodieren Sie Base64 in eine Audiodatei:
Linux
- Kopieren Sie nur die Base64-codierten Inhalte in eine Textdatei. 
- Decodieren Sie die Datei, die den Quelltext enthält, mit dem Base64-Befehlszeilentool mit dem Flag - -d:
$ base64 SOURCE_BASE64_TEXT_FILE -d > DESTINATION_AUDIO_FILE
Mac OSX
- Kopieren Sie nur die Base64-codierten Inhalte in eine Textdatei. 
- Decodieren Sie die Datei, die den Quelltext enthält, mit dem base64-Befehlszeilentool: 
$ base64 --decode -i SOURCE_BASE64_TEXT_FILE > DESTINATION_AUDIO_FILE
Windows
- Kopieren Sie nur die Base64-codierten Inhalte in eine Textdatei. 
- Decodieren Sie die Datei, die den Quelltext enthält, mit dem Befehl - certutil.
certutil -decode SOURCE_BASE64_TEXT_FILE DESTINATION_AUDIO_FILE