音訊資料為二進位資料。您可以直接從 gRPC 回覆讀取二進位資料。不過,回覆 REST 要求時會使用 JSON。由於 JSON 是一種文字格式,不直接支援二進位資料,因此 Text-to-Speech 會傳回以 Base64 編碼的回覆字串。您必須先將回覆中的 Base64 編碼文字資料轉換成二進位資料,才能在裝置上播放。
Text-to-Speech 傳回的 JSON 回覆在 audioContent 欄位中含有 Base64 編碼的音訊內容。例如:
{
"audioContent": "//NExAARqoIIAAhEuWAAAGNmBGMY4EBcxvABAXBPmPIAF//yAuh9Tn5CEap3/o..."
}
若要將 base64 解碼成音訊檔案:
Linux
僅將 Base64 編碼內容複製到文字檔。
透過 Base64 指令列工具並使用
-d標記來解碼來源文字檔:
$ base64 SOURCE_BASE64_TEXT_FILE -d > DESTINATION_AUDIO_FILE
Mac OSX
僅將 base-64 編碼內容複製到文字檔。
使用 base64 指令列工具解碼來源文字檔:
$ base64 --decode -i SOURCE_BASE64_TEXT_FILE > DESTINATION_AUDIO_FILE
Windows
僅將 Base64 編碼內容複製到文字檔。
使用
certutil指令解碼來源文字檔。
certutil -decode SOURCE_BASE64_TEXT_FILE DESTINATION_AUDIO_FILE