音频编码简介

如需了解音频编码,请参阅 Speech-to-Text 文档中的音频编码简介

支持的音频编码

Media Translation API 支持多种不同的编码。下表列出了支持的音频编解码器:

编解码器 名称 无损 使用说明
AMR 自适应多速率窄带 采样率必须为 8000 Hz
AMR_WB 自适应多速率宽带 采样率必须为 16000 Hz
FLAC 免费无损音频编解码器 信息流要求使用 16 位或 24 位的位深
LINEAR16 线性 PCM 16 位线性脉冲编码调制 (PCM) 编码
MP3 MPEG 第三层音频 MP3 音频。支持所有标准 MP3 比特率(范围为 32-320 kbps)。使用此编码时,sample_rate_hertz 必须与所用文件的采样率匹配。
MULAW μ 律 8 位 PCM 编码
OGG_OPUS Ogg 容器中的 Opus 编码音频帧 采样率必须为 8000 Hz、12000 Hz、16000 Hz、24000 Hz 或 48000 Hz 之一