Introduzione alla codifica audio

Per informazioni sulla codifica audio, consulta la sezione Introduzione alla codifica audio nella documentazione di Speech-to-Text.

Codifiche audio supportate

L'API Media Translation supporta una serie di codifiche diverse. Nella tabella che segue sono elencati i codec audio supportati:

Codec Nome Senza perdita di dati Note sull'utilizzo
AMR Narrowband multi-rate adattivo No La frequenza di campionamento deve essere 8000 Hz
AMR_WB Adaptive Multi-Rate Wideband No La frequenza di campionamento deve essere 16000 Hz
FLAC Codec audio senza perdita di dati 16 bit o 24 bit richiesti per gli stream
LINEAR16 PCM lineare Codifica PCM (Pulse Code Modulation) lineare a 16 bit
MP3 MPEG Audio Layer III No Audio MP3. Supporta tutti i velocità in bit standard MP3 (che vanno da 32 a 320 kbps). Quando utilizzi questa codifica, sample_rate_hertz deve corrispondere alla frequenza di campionamento del file utilizzato.
MULAW Legge di μ No Codifica PCM a 8 bit
OGG_OPUS Frame audio codificati in Opus in un contenitore Ogg No La frequenza di campionamento deve essere 8000 Hz, 12000 Hz, 16000 Hz, 24000 Hz, o 48000 Hz