Para obtener información sobre la codificación de audio, consulta Introducción a la codificación de audio en la documentación de Speech-to-Text.
Codificaciones de audio compatibles
La API de traducción de medios admite varias codificaciones diferentes. En la siguiente tabla, se enumeran los códecs de audio compatibles:
Códec | Nombre | Sin pérdida | Notas de uso |
---|---|---|---|
AMR |
Banda estrecha con tasas de transferencia múltiples adaptables | No | La tasa de muestreo debe ser de 8,000 Hz. |
AMR_WB |
Banda ancha con tasas de transferencia múltiples adaptables | No | La tasa de muestreo debe ser de 16,000 Hz. |
FLAC |
Códec de audio sin pérdida gratuito | Sí | Se requieren 16 bits o 24 bits para transmisión continua. |
LINEAR16 |
PCM lineal | Sí | Codificación de modulación lineal por impulsos codificados (PCM) de 16 bits |
MP3 |
Capa de audio MPEG III | No | Audio en MP3 Admite todas las tasas de bits de MP3 estándar (que van desde 32 hasta 320 kbps). Cuando se usa esta codificación, sample_rate_hertz debe coincidir con la tasa de muestreo del archivo que se usa. |
MULAW |
Ley μ | No | Codificación PCM de 8 bits |
OGG_OPUS |
Tramas de audio con codificación Opus en un contenedor Ogg | No | La tasa de muestreo debe ser una de las siguientes: 8,000 Hz, 12,000 Hz, 16,000 Hz, 24,000 Hz o 48,000 Hz. |