Los datos de audio son datos binarios. Puedes leer los datos binarios directamente desde una respuesta de gRPC; sin embargo, JSON se usa cuando se responde a una solicitud de REST. Como JSON es un formato de texto que no admite directamente datos binarios, Text-to-Speech muestra una string de respuesta codificada en Base64. Debes convertir los datos de texto codificados en Base64 de la respuesta a objetos binarios para poder reproducirlos en un dispositivo.
Las respuestas JSON de Text-to-Speech incluyen contenido de audio codificado en Base64 en el campo audioContent
. Por ejemplo:
{ "audioContent": "//NExAARqoIIAAhEuWAAAGNmBGMY4EBcxvABAXBPmPIAF//yAuh9Tn5CEap3/o..." }
Para decodificar el contenido en Base64 en un archivo de audio:
Linux
Copia solo el contenido codificado en Base64 en un archivo de texto.
Para decodificar el archivo de texto fuente con la herramienta de línea de comandos de Base64, usa la marca
-d
:
$ base64 source_base64_text_file -d > dest_audio_file
macOS
Copia solo el contenido codificado en Base64 en un archivo de texto.
Decodifica el archivo de texto de origen con la herramienta de línea de comandos de Base64:
$ base64 --decode source_base64_text_file > dest_audio_file
Windows
Copia solo el contenido codificado en Base64 en un archivo de texto.
Decodifica el archivo de texto de origen con el comando
certutil
.
certutil -decode encodedInputFileName decodedOutputFileName