Présentation de l'encodage audio

Sur le concept d'encodage audio, l'utilisateur peut se référer à la page de présentation Cloud Speech-to-Text.

Encodages audio compatibles

L'API Media Translation est compatible avec de nombreux encodages différents. Le tableau suivant répertorie les codecs audio compatibles :

Codec Nom Sans perte Remarques sur l'utilisation
AMR Bande étroite AMR Non Le taux d'échantillonnage doit être défini sur 8 000 Hz.
AMR_WB Large bande AMR Non Le taux d'échantillonnage doit être défini sur 16 000 Hz.
FLAC Codec audio gratuit sans perte Oui 16 bits ou 24 bits sont requis pour les flux.
LINEAR16 PCM linéaire Oui Modulation par impulsions et codage (PCM) linéaire 16 bits
MP3 MPEG Audio Layer III Non Audio MP3. Compatibilité avec tous les débits MP3 standards (de 32 à 320 kbit/s). Lorsque vous utilisez cet encodage, sample_rate_hertz doit correspondre au taux d'échantillonnage du fichier utilisé.
MULAW Loi μ Non Encodage PCM 8 bits
OGG_OPUS Trames audio encodées au format Opus dans un conteneur Ogg Non Le taux d'échantillonnage doit être défini sur 8 000 Hz, 12 000 Hz, 16 000 Hz, 24 000 Hz ou 48 000 Hz.