音频数据是二进制数据。您可以从 gRPC 响应直接读取二进制数据;但系统响应 REST 请求时使用的是 JSON 格式。因为 JSON 是文本格式,不直接支持二进制数据,所以 Text-to-Speech 会返回以 Base64 中编码的响应字符串。您必须先将响应中的 base64 编码文本数据转换为二进制,然后才能在设备上播放它。
Text-to-Speech 返回的 JSON 响应包括 audioContent
字段中的 base64 编码音频内容。例如:
{ "audioContent": "//NExAARqoIIAAhEuWAAAGNmBGMY4EBcxvABAXBPmPIAF//yAuh9Tn5CEap3/o..." }
要将 base64 内容解码到音频文件,请执行以下操作:
Linux
仅将使用 base64 编码的内容复制到文本文件中。
使用 base64 命令行工具通过
-d
标志对源文本文件进行解码:
$ base64 SOURCE_BASE64_TEXT_FILE -d > DESTINATION_AUDIO_FILE
Mac OSX
仅将使用 base64 编码的内容复制到文本文件中。
使用 base64 命令行工具对源文本文件进行解码:
$ base64 --decode -i SOURCE_BASE64_TEXT_FILE > DESTINATION_AUDIO_FILE
Windows
仅将使用 base64 编码的内容复制到文本文件中。
使用
certutil
命令对源文本文件进行解码。
certutil -decode SOURCE_BASE64_TEXT_FILE DESTINATION_AUDIO_FILE