Présentation de l'encodage audio

Pour plus d'informations sur l'encodage audio, consultez la page Présentation de l'encodage audio dans la documentation sur Speech-to-Text.

Encodages audio compatibles

L'API Media Translation est compatible avec de nombreux encodages différents. Le tableau suivant répertorie les codecs audio compatibles :

Codec Nom Sans perte Remarques sur l'utilisation
AMR Bande étroite AMR Non Le taux d'échantillonnage doit être défini sur 8 000 Hz.
AMR_WB Large bande AMR Non Le taux d'échantillonnage doit être défini sur 16 000 Hz.
FLAC Codec audio gratuit sans perte Oui 16 bits ou 24 bits sont requis pour les flux.
LINEAR16 PCM linéaire Oui Modulation par impulsions et codage (PCM) linéaire 16 bits
MP3 MPEG Audio Layer III Non Audio MP3. Compatibilité avec tous les débits MP3 standards (de 32 à 320 kbit/s). Lorsque vous utilisez cet encodage, sample_rate_hertz doit correspondre au taux d'échantillonnage du fichier utilisé.
MULAW Loi μ Non Encodage PCM 8 bits
OGG_OPUS Trames audio encodées au format Opus dans un conteneur Ogg Non Le taux d'échantillonnage doit être défini sur 8 000 Hz, 12 000 Hz, 16 000 Hz, 24 000 Hz ou 48 000 Hz.