Posição do microfone

Esta seção lista as especificações mínimas para o microfone e o sistema de áudio em uma implementação do Speech. O microfone determina o desempenho da biblioteca do Speech.

1.1. Número e posição

  • É necessário ter pelo menos um microfone voltado para o usuário.
  • (Recomendado) Dois microfones com espaçamento de 66 a 71 mm em uma superfície plana voltada para o usuário.
  • Posicione-se longe de fontes de som para minimizar o acoplamento de áudio entre o microfone e os alto-falantes.

1.2. Pré-processamento de áudio

  • O app de fala precisa acessar o sinal de microfone bruto.
  • Não execute variantes de tempo ou processamento não linear no áudio.
  • (Recomendado) Não realize beamforming, outras técnicas de combinação de microfones nem outros pré-processamentos de áudio no sinal de áudio fornecido ao aplicativo de fala.

1.3 Taxa de amostragem

As implementações precisam usar uma taxa de amostragem de microfone de 16 KHz.

1.4. Desempenho da entrada

O microfone:

  • Precisa ser capaz de capturar som a SPL de 94 dB sem saturação.
  • Precisa ser capaz de capturar sons típicos na região linear da sensibilidade do microfone.
  • Os pontos de sobrecarga acústica (AOP, na sigla em inglês) precisam ser pelo menos 10 dB mais altos do que a entrada gerada pelo alto-falante para o microfone entre 125 Hz e 8 KHz. Nos testes do Google, os microfones digitais com AOP maior que 130 dB tiveram um bom desempenho.
  • Precisa ter distorção harmônica total (THD, na sigla em inglês) de 1% ou menos para um sinal SPL de 94 dB entre 100 Hz e 8 KHz.
  • A resposta de frequência dos microfones precisa ser estável, +/- 3 dB, medida em 1/1 oitava de 125 Hz a 8 KHz. Os microfones que podem ter uma resposta simples PODEM ser corrigidos com filtros, que precisam ser lineares e invariáveis.

1.5. Indicador de entrada

O sinal de entrada para o aplicativo de fala do microfone precisa atender aos seguintes requisitos:

  • É necessário configurar o parâmetro de sensibilidade do microfone com base nas leituras calibradas do microfone.
    • Grave a resposta de frequência do microfone DUT ao reproduzir o sinal do alto-falante de referência calibrado.
    • O sinal de entrada dos microfones é de SPL de 94 dB.
    • A 16 KHz, profundidade de 24 a 32 bits, sinal de entrada para o aplicativo de fala: dentro de +/- 3 dB de um RMS de sensibilidade do microfone.

1.6. Profundidade de bit

A profundidade de bits do sinal do microfone para a fala não pode ser inferior a 16 bits.