Pour plus d'informations sur l'encodage audio, consultez la page Présentation de l'encodage audio dans la documentation sur Speech-to-Text.
Encodages audio compatibles
L'API Media Translation est compatible avec de nombreux encodages différents. Le tableau suivant répertorie les codecs audio compatibles :
Codec | Nom | Sans perte | Remarques sur l'utilisation |
---|---|---|---|
AMR |
Bande étroite AMR | Non | Le taux d'échantillonnage doit être défini sur 8 000 Hz. |
AMR_WB |
Large bande AMR | Non | Le taux d'échantillonnage doit être défini sur 16 000 Hz. |
FLAC |
Codec audio gratuit sans perte | Oui | 16 bits ou 24 bits sont requis pour les flux. |
LINEAR16 |
PCM linéaire | Oui | Modulation par impulsions et codage (PCM) linéaire 16 bits |
MP3 |
MPEG Audio Layer III | Non | Audio MP3. Compatibilité avec tous les débits MP3 standards (de 32 à 320 kbit/s). Lorsque vous utilisez cet encodage, sample_rate_hertz doit correspondre au taux d'échantillonnage du fichier utilisé. |
MULAW |
Loi μ | Non | Encodage PCM 8 bits |
OGG_OPUS |
Trames audio encodées au format Opus dans un conteneur Ogg | Non | Le taux d'échantillonnage doit être défini sur 8 000 Hz, 12 000 Hz, 16 000 Hz, 24 000 Hz ou 48 000 Hz. |