Introduzione alla codifica audio

Per informazioni sulla codifica audio, consulta la sezione Introduzione alla codifica audio nella documentazione di Speech-to-Text.

Codifiche audio supportate

L'API Media Translation supporta una serie di codifiche diverse. La seguente tabella elenca i codec audio supportati:

Codec Nome Senza perdita di dati Note sull'utilizzo
AMR Stretta a più velocità adattiva No La frequenza di campionamento deve essere 8000 Hz
AMR_WB Banda larga multifrequenza adattiva No La frequenza di campionamento deve essere 16000 Hz
FLAC Codec audio senza perdita di dati Richiesto per gli stream: 16 o 24 bit
LINEAR16 PCM lineare Codifica a modulazione di impulsi lineare (PCM) a 16 bit
MP3 Livello audio MPEG III No Audio MP3. Supporta tutte le velocità in bit MP3 standard (che vanno da 32 a 320 kbps). Quando viene utilizzata questa codifica, sample_rate_hertz deve corrispondere alla frequenza di campionamento del file in uso.
MULAW μ-law No Codifica PCM a 8 bit
OGG_OPUS Frame di audio codificati Opus in un container Ogg No La frequenza di campionamento deve essere una di 8000 Hz, 12000 Hz, 16000 Hz, 24000 Hz o 48000 Hz