Base64 でエンコードされた音声コンテンツのデコード

音声データはバイナリデータです。バイナリデータは、gRPC レスポンスから直接読み取ることができますが、REST リクエストへのレスポンスには JSON が使用されます。JSON はバイナリデータを直接サポートしていないテキスト形式であるため、Text-to-Speech は Base64 でエンコードされたレスポンス文字列を返します。レスポンス内の、Base64 でエンコードされたテキストデータをデバイスで再生するには、そのテキストデータをバイナリに変換する必要があります。

Text-to-Speech からの JSON レスポンスでは、audioContent フィールドに base64 でエンコードされた音声コンテンツが格納されています。例:

{
  "audioContent": "//NExAARqoIIAAhEuWAAAGNmBGMY4EBcxvABAXBPmPIAF//yAuh9Tn5CEap3/o..."
}

base64 を音声ファイルにデコードするには:

Linux

  1. base-64 エンコード形式のコンテンツのみをテキスト ファイルにコピーします。

  2. base64 コマンドライン ツールで -d フラグを使用してソーステキスト ファイルをデコードします。

    $ base64 source_base64_text_file -d > dest_audio_file

Mac OSX

  1. base-64 エンコード形式のコンテンツのみをテキスト ファイルにコピーします。

  2. base64 コマンドライン ツールを使用してソース テキスト ファイルをデコードします。

    $ base64 --decode source_base64_text_file > dest_audio_file

Windows

  1. base-64 エンコード形式のコンテンツのみをテキスト ファイルにコピーします。

  2. Base64.exe ツールを使用してソーステキスト ファイルをデコードします。

    C:> Base64.exe -d source_base64_text_file > dest_audio_file