Per informazioni sulla codifica audio, consulta la sezione Introduzione alla codifica audio nella documentazione di Speech-to-Text.
Codifiche audio supportate
L'API Media Translation supporta una serie di codifiche diverse. La seguente tabella elenca i codec audio supportati:
Codec | Nome | Senza perdita di dati | Note sull'utilizzo |
---|---|---|---|
AMR |
Stretta a più velocità adattiva | No | La frequenza di campionamento deve essere 8000 Hz |
AMR_WB |
Banda larga multifrequenza adattiva | No | La frequenza di campionamento deve essere 16000 Hz |
FLAC |
Codec audio senza perdita di dati | Sì | Richiesto per gli stream: 16 o 24 bit |
LINEAR16 |
PCM lineare | Sì | Codifica a modulazione di impulsi lineare (PCM) a 16 bit |
MP3 |
Livello audio MPEG III | No | Audio MP3. Supporta tutte le velocità in bit MP3 standard (che vanno da 32 a 320 kbps). Quando viene utilizzata questa codifica, sample_rate_hertz deve corrispondere alla frequenza di campionamento del file in uso. |
MULAW |
μ-law | No | Codifica PCM a 8 bit |
OGG_OPUS |
Frame di audio codificati Opus in un container Ogg | No | La frequenza di campionamento deve essere una di 8000 Hz, 12000 Hz, 16000 Hz, 24000 Hz o 48000 Hz |