I dati audio sono dati binari. Puoi leggere i dati binari direttamente da un file gRPC response; ma quando si risponde a una richiesta REST viene usato JSON. Poiché JSON è un formato di testo che non supporta direttamente i dati binari, Text-to-Speech restituisce una stringa di risposta codificata in Base64. Devi convertire il formato con codifica Base64 i dati di testo della risposta al file binario prima di poterli riprodurre su un dispositivo.
Le risposte JSON della sintesi vocale includono contenuti audio codificati in base64 nel campo audioContent
. Ad esempio:
{ "audioContent": "//NExAARqoIIAAhEuWAAAGNmBGMY4EBcxvABAXBPmPIAF//yAuh9Tn5CEap3/o..." }
Per decodificare il base64 in un file audio:
Linux
Copia solo i contenuti con codifica Base64 in un file di testo.
Decodifica il file di testo di origine utilizzando lo strumento a riga di comando base64 tramite il flag
-d
:
$ base64 SOURCE_BASE64_TEXT_FILE -d > DESTINATION_AUDIO_FILE
Mac OSX
Copia solo i contenuti con codifica Base64 in un file di testo.
Decodifica il file di testo di origine utilizzando lo strumento a riga di comando base64:
$ base64 --decode -i SOURCE_BASE64_TEXT_FILE > DESTINATION_AUDIO_FILE
Windows
Copia solo i contenuti codificati in base64 in un file di testo.
Decodifica il file di testo di origine utilizzando il metodo Comando
certutil
.
certutil -decode SOURCE_BASE64_TEXT_FILE DESTINATION_AUDIO_FILE