오디오 인코딩에 대한 자세한 내용은 Speech-to-Text 문서의 오디오 인코딩 소개를 참조하세요.
지원되는 오디오 인코딩
Media Translation API는 다양한 인코딩을 지원합니다. 아래 표에는 지원되는 오디오 코덱이 나열되어 있습니다.
코덱 | 이름 | 무손실 | 사용 참고사항 |
---|---|---|---|
AMR |
Adaptive Multi-Rate Narrowband | 아니요 | 샘플링 레이트가 8000Hz여야 함 |
AMR_WB |
AMR-WB(Adaptive Multi-Rate Wideband) | 아니요 | 샘플링 레이트가 16000Hz여야 함 |
FLAC |
무료 무손실 오디오 코덱 | 예 | 스트림에 16비트 또는 24비트 필요 |
LINEAR16 |
리니어 PCM | 예 | 16비트 선형 펄스 코드 변조(PCM) 인코딩 |
MP3 |
MPEG 오디오 레이어 III | 아니요 | MP3 오디오. 32~320kbps 범위의 모든 표준 MP3 비트 전송률을 지원합니다. 이 인코딩을 사용할 때 sample_rate_hertz 는 사용 중인 파일의 샘플링 레이트와 일치해야 합니다. |
MULAW |
μ-law | 아니요 | 8비트 PCM 인코딩 |
OGG_OPUS |
Ogg 컨테이너의 Opus 인코딩된 오디오 프레임 | 아니요 | 샘플링 레이트가 8000Hz, 12000Hz, 16000Hz, 24000Hz, 48000Hz 중 하나여야 함 |