Para informações sobre codificação de áudio, consulte Introdução à codificação de áudio na documentação da Speech-to-Text
Codificações de áudio compatíveis
A API Media Translation é compatível com várias codificações diferentes. A tabela a seguir lista codecs de áudio compatíveis:
Codec | Nome | Sem perdas | Notas de uso |
---|---|---|---|
AMR |
Adaptive Multi-Rate banda estreita | Não | A taxa de amostra precisa ser 8.000 Hz |
AMR_WB |
Adaptive Multi-Rate banda larga | Não | A taxa de amostragem precisa ser 16.000 Hz |
FLAC |
Codec de áudio livre sem perdas | Sim | 16 bits ou 24 bits obrigatórios para o stream |
LINEAR16 |
Modulação por código de pulso linear | Sim | Codificação de modulação de código de pulso linear de 16 bits (PCM) |
MP3 |
Camada de áudio MPEG III | Não | Áudio MP3. Compatível com todas as taxas de bits padrão de MP3, que variam de 32 a 320 kbps. Ao usar essa codificação, sample_rate_hertz precisa corresponder à taxa de amostragem do arquivo que está sendo usado. |
MULAW |
μ-law | Não | Codificação PCM de 8 bits |
OGG_OPUS |
Frames de áudio codificados Opus em um contêiner Ogg | Não | A taxa de amostragem precisa ser de 8.000 Hz, 12.000 Hz, 16.000 Hz, 24.000 Hz ou 48.000 Hz |