Untuk mengetahui informasi tentang encoding audio, lihat Pengantar encoding audio dalam dokumentasi Speech-to-Text.
Encoding audio yang didukung
Media Translation API mendukung sejumlah encoding yang berbeda. Tabel berikut mencantumkan codec audio yang didukung:
Codec | Nama | Lossless | Catatan Penggunaan |
---|---|---|---|
AMR |
Narrowband Multi-Kecepatan Adaptif | Tidak | Frekuensi sampel harus 8.000 Hz |
AMR_WB |
Wideband Multi-Kecepatan Adaptif | Tidak | Frekuensi sampel harus 16.000 Hz |
FLAC |
Codec Audio Lossless Gratis | Ya | 16-bit atau 24-bit diperlukan untuk streaming |
LINEAR16 |
PCM Linear | Ya | Encoding modulasi kode pulsa (PCM) linear 16-bit |
MP3 |
MPEG Audio Layer III | Tidak | Audio MP3. Mendukung semua kecepatan bit MP3 standar (yang berkisar dari 32-320 kbps). Saat menggunakan encoding ini, sample_rate_hertz harus cocok dengan frekuensi sampel file yang digunakan. |
MULAW |
hukum μ | Tidak | Encoding PCM 8-bit |
OGG_OPUS |
Frame audio yang dienkode Opus dalam container Ogg | Tidak | Frekuensi sampel harus salah satu dari 8.000 Hz, 12.000 Hz, 16.000 Hz, 24.000 Hz, atau 48.000 Hz |