Introducción a la codificación de audio

Para el concepto de codificación de audio, el usuario podría hacer referencia a la página de Cloud Speech-to-Text.

Codificaciones de audio compatibles

La API de traducción de medios admite varias codificaciones diferentes. En la siguiente tabla, se enumeran los códecs de audio compatibles:

Códec Nombre Sin pérdida Notas de uso
AMR Banda estrecha con tasas de transferencia múltiples adaptables No La tasa de muestreo debe ser de 8,000 Hz.
AMR_WB Banda ancha con tasas de transferencia múltiples adaptables No La tasa de muestreo debe ser de 16,000 Hz.
FLAC Códec de audio sin pérdida gratuito Se requieren 16 bits o 24 bits para transmisión continua.
LINEAR16 PCM lineal Codificación de modulación lineal por impulsos codificados (PCM) de 16 bits
MP3 Capa de audio MPEG III No Audio en MP3 Admite todas las tasas de bits de MP3 estándar (que van desde 32 hasta 320 kbps). Cuando se usa esta codificación, sample_rate_hertz debe coincidir con la tasa de muestreo del archivo que se usa.
MULAW Ley μ No Codificación PCM de 8 bits
OGG_OPUS Tramas de audio con codificación Opus en un contenedor Ogg No La tasa de muestreo debe ser una de las siguientes: 8,000 Hz, 12,000 Hz, 16,000 Hz, 24,000 Hz o 48,000 Hz.