I dati audio sono dati binari. Puoi leggere i dati binari direttamente da una risposta gRPC. Tuttavia, JSON viene utilizzato per rispondere a una richiesta REST. Poiché JSON è un formato di testo che non supporta direttamente i dati binari, Text-to-Speech restituisce una stringa di risposta codificata in Base64. Devi convertire i dati di testo codificati in base64 della risposta in formato binario prima di poterli riprodurre su un dispositivo.
Le risposte JSON di Text-to-Speech includono contenuti audio codificati in base64 nel campo audioContent
. Ad esempio:
{ "audioContent": "//NExAARqoIIAAhEuWAAAGNmBGMY4EBcxvABAXBPmPIAF//yAuh9Tn5CEap3/o..." }
Per decodificare il base64 in un file audio:
Linux
Copia solo i contenuti codificati in base64 in un file di testo.
Decodifica il file di testo di origine utilizzando lo strumento a riga di comando base64 tramite il flag
-d
:
$ base64 SOURCE_BASE64_TEXT_FILE -d > DESTINATION_AUDIO_FILE
Mac OSX
Copia solo i contenuti codificati in base64 in un file di testo.
Decodifica il file di testo di origine utilizzando lo strumento a riga di comando base64:
$ base64 --decode -i SOURCE_BASE64_TEXT_FILE > DESTINATION_AUDIO_FILE
Windows
Copia solo i contenuti codificati in base64 in un file di testo.
Decodifica il file di testo di origine utilizzando il comando
certutil
.
certutil -decode SOURCE_BASE64_TEXT_FILE DESTINATION_AUDIO_FILE