Einführung in die Audiocodierung

Informationen zur Audiocodierung finden Sie unter Einführung in die Audiocodierung in der Speech-to-Text-Dokumentation.

Unterstützte Audiocodierungen

Die Media Translation API unterstützt eine Reihe verschiedener Codierungen. In der nachstehenden Tabelle sind die unterstützten Audio-Codecs aufgelistet:

Codec Name Verlustfrei Hinweise zur Verwendung
AMR Adaptive Multi-Rate Narrowband Nein Abtastrate muss 8.000 Hz sein
AMR_WB Adaptive Multi-Rate Wideband Nein Abtastrate muss 16.000 Hz sein
FLAC Free Lossless Audio Codec Ja 16 Bit oder 24 Bit für Streams
LINEAR16 Linear PCM Ja 16-Bit-Codierung mit linearer Pulscodemodulation (PCM)
MP3 MPEG Audio Layer III Nein MP3-Audio. Unterstützt alle gängigen MP3-Bitraten (von 32 bis 320 kbit/s). Bei Verwendung dieser Codierung muss sample_rate_hertz mit der Abtastrate der verwendeten Datei übereinstimmen.
MULAW μ-law Nein 8-Bit-PCM-Codierung
OGG_OPUS Opus-codierte Audioframes in einem Ogg-Container Nein Abtastrate muss 8.000 Hz, 12.000 Hz, 16.000 Hz, 24.000 Hz oder 48.000 Hz sein.