I dati audio sono dati binari. Puoi leggere i dati binari direttamente da una risposta gRPC. Tuttavia, JSON viene utilizzato per rispondere a una richiesta REST. Poiché JSON è un formato di testo che non supporta direttamente i dati binari, Text-to-Speech restituisce una stringa di risposta codificata in Base64. Devi convertire i dati di testo codificati in base64 della risposta in formato binario prima di poterli riprodurre su un dispositivo.
Le risposte JSON della sintesi vocale includono contenuti audio codificati in base64 nel campo audioContent
. Ad esempio:
{ "audioContent": "//NExAARqoIIAAhEuWAAAGNmBGMY4EBcxvABAXBPmPIAF//yAuh9Tn5CEap3/o..." }
Per decodificare il base64 in un file audio:
Linux
Copia solo i contenuti codificati in base64 in un file di testo.
Decodifica il file di testo di origine utilizzando lo strumento a riga di comando base64 tramite il flag
-d
:
$ base64 SOURCE_BASE64_TEXT_FILE -d > DESTINATION_AUDIO_FILE
Mac OSX
Copia solo i contenuti codificati in base64 in un file di testo.
Decodifica il file di testo di origine utilizzando lo strumento a riga di comando base64:
$ base64 --decode -i SOURCE_BASE64_TEXT_FILE > DESTINATION_AUDIO_FILE
Windows
Copia solo i contenuti codificati in base64 in un file di testo.
Decodifica il file di testo di origine utilizzando il comando
certutil
.
certutil -decode SOURCE_BASE64_TEXT_FILE DESTINATION_AUDIO_FILE