오디오 데이터는 바이너리 데이터입니다. gRPC 응답에서 직접 바이너리 데이터를 읽을 수 있지만 REST 요청에 응답할 때는 JSON이 사용됩니다. JSON은 바이너리 데이터를 직접 지원하지 않는 텍스트 형식이므로 Text-to-Speech가 Base64로 인코딩된 응답 문자열을 반환합니다. 기기에서 재생하려면 먼저 base64로 인코딩된 텍스트 데이터를 응답에서 바이너리로 변환해야 합니다.
Text-to-Speech의 JSON 응답은 base64로 인코딩된 오디오 콘텐츠를 audioContent
필드에 포함합니다. 예를 들면 다음과 같습니다.
{ "audioContent": "//NExAARqoIIAAhEuWAAAGNmBGMY4EBcxvABAXBPmPIAF//yAuh9Tn5CEap3/o..." }
base64를 오디오 파일로 디코딩하려면 다음 안내를 따르세요.
Linux
base-64로 인코딩된 콘텐츠만 텍스트 파일에 복사합니다.
base64 명령줄 도구에서
-d
플래그를 사용하여 소스 텍스트 파일을 디코딩합니다.
$ base64 SOURCE_BASE64_TEXT_FILE -d > DESTINATION_AUDIO_FILE
Mac OSX
base-64로 인코딩된 콘텐츠만 텍스트 파일에 복사합니다.
base64 명령줄 도구를 사용하여 원본 텍스트 파일을 디코딩합니다.
$ base64 --decode -i SOURCE_BASE64_TEXT_FILE > DESTINATION_AUDIO_FILE
Windows
base-64로 인코딩된 콘텐츠만 텍스트 파일에 복사합니다.
certutil
명령어를 사용하여 원본 텍스트 파일을 디코딩합니다.
certutil -decode SOURCE_BASE64_TEXT_FILE DESTINATION_AUDIO_FILE