Posizione del microfono

Questa sezione elenca le specifiche minime per il microfono e il sistema audio in un'implementazione vocale. Il microfono determina le prestazioni della libreria Speech.

1.1. Numero e posizionamento

  • Deve avere almeno un microfono rivolto verso l'utente.
  • (Consigliato) Due microfoni con una spaziatura da centro a centro (66 mm e 71 mm) su una superficie piana rivolta verso l'utente.
  • Posizionare lontano da fonti di suono per ridurre al minimo l'accoppiamento audio tra microfono e altoparlanti.

1.2 Pre-elaborazione audio

  • Deve consentire all'applicazione vocale di accedere al segnale del microfono non elaborato.
  • Non eseguire sull'audio l'elaborazione di variazioni temporali o non lineari.
  • (Consigliato) Non eseguire il beamforming, altre tecniche di combinazione dei microfoni o altre pre-elaborazione audio sul segnale audio fornito all'applicazione vocale.

1.3. Frequenza di campionamento

le implementazioni devono utilizzare una frequenza di campionamento del microfono di 16 KHz.

1.4. Rendimento input

Il microfono:

  • Deve essere in grado di acquisire l'audio a 94 dB SPL senza saturazione.
  • Deve essere in grado di acquisire suoni tipici nella regione lineare della sensibilità del microfono.
  • I punti di sovraccarico acustico (AOP) devono essere almeno 10 dB più alti dell'input del microfono generato dall'altoparlante tra 125 Hz e 8 KHz. Nei test di Google, i microfoni digitali con AOP superiore a 130 dB hanno avuto un buon rendimento.
  • Deve avere una distorsione armonica totale (THD) pari o inferiore all'1% per un segnale SPL di 94 dB compreso tra 100 Hz e 8 KHz.
  • La risposta in frequenza dei microfoni deve essere piatta, +/- 3 dB, misurata in 1/1 d'ottava da 125 Hz a 8 KHz. I microfoni con una risposta piatta POTREBBERO essere corretti tramite filtri, che devono essere lineari e non nel tempo.

1.5 Segnale di ingresso

Il segnale di ingresso all'applicazione vocale dal microfono deve soddisfare i seguenti requisiti:

  • Devi configurare il parametro di sensibilità del microfono con precisione in base alle letture calibrate del microfono.
    • Registra la risposta in frequenza del microfono DUT durante la riproduzione del segnale dall'altoparlante di riferimento calibrato.
    • Il segnale in ingresso ai microfoni è 94 dB SPL.
    • A 16 KHz, 24-32 bit di profondità, segnale di ingresso per l'applicazione vocale: entro +/- 3dB di un RMS di sensibilità del microfono.

1.6. Profondità di bit

La profondità in bit del segnale vocale del microfono non deve essere inferiore a 16 bit.