Informationen zur Audiocodierung finden Sie unter Einführung in die Audiocodierung in der Speech-to-Text-Dokumentation.
Unterstützte Audiocodierungen
Die Media Translation API unterstützt eine Reihe verschiedener Codierungen. In der nachstehenden Tabelle sind die unterstützten Audio-Codecs aufgelistet:
Codec | Name | Verlustfrei | Hinweise zur Verwendung |
---|---|---|---|
AMR |
Adaptive Multi-Rate Narrowband | Nein | Abtastrate muss 8.000 Hz sein |
AMR_WB |
Adaptive Multi-Rate Wideband | Nein | Abtastrate muss 16.000 Hz sein |
FLAC |
Free Lossless Audio Codec | Ja | 16 Bit oder 24 Bit für Streams |
LINEAR16 |
Linear PCM | Ja | 16-Bit-Codierung mit linearer Pulscodemodulation (PCM) |
MP3 |
MPEG Audio Layer III | Nein | MP3-Audio. Unterstützt alle gängigen MP3-Bitraten (von 32 bis 320 kbit/s). Bei Verwendung dieser Codierung muss sample_rate_hertz mit der Abtastrate der verwendeten Datei übereinstimmen. |
MULAW |
μ-law | Nein | 8-Bit-PCM-Codierung |
OGG_OPUS |
Opus-codierte Audioframes in einem Ogg-Container | Nein | Abtastrate muss 8.000 Hz, 12.000 Hz, 16.000 Hz, 24.000 Hz oder 48.000 Hz sein. |