Posizione del microfono
Questa sezione elenca le specifiche minime per il microfono e il sistema audio in un'implementazione vocale. Il microfono determina le prestazioni della libreria Speech.
1.1. Numero e posizionamento
- Deve avere almeno un microfono rivolto verso l'utente.
- (Consigliato) Due microfoni con una spaziatura da centro a centro (66 mm e 71 mm) su una superficie piana rivolta verso l'utente.
- Posizionare lontano da fonti di suono per ridurre al minimo l'accoppiamento audio tra microfono e altoparlanti.
1.2 Pre-elaborazione audio
- Deve consentire all'applicazione vocale di accedere al segnale del microfono non elaborato.
- Non eseguire sull'audio l'elaborazione di variazioni temporali o non lineari.
- (Consigliato) Non eseguire il beamforming, altre tecniche di combinazione dei microfoni o altre pre-elaborazione audio sul segnale audio fornito all'applicazione vocale.
1.3. Frequenza di campionamento
le implementazioni devono utilizzare una frequenza di campionamento del microfono di 16 KHz.
1.4. Rendimento input
Il microfono:
- Deve essere in grado di acquisire l'audio a 94 dB SPL senza saturazione.
- Deve essere in grado di acquisire suoni tipici nella regione lineare della sensibilità del microfono.
- I punti di sovraccarico acustico (AOP) devono essere almeno 10 dB più alti dell'input del microfono generato dall'altoparlante tra 125 Hz e 8 KHz. Nei test di Google, i microfoni digitali con AOP superiore a 130 dB hanno avuto un buon rendimento.
- Deve avere una distorsione armonica totale (THD) pari o inferiore all'1% per un segnale SPL di 94 dB compreso tra 100 Hz e 8 KHz.
- La risposta in frequenza dei microfoni deve essere piatta, +/- 3 dB, misurata in 1/1 d'ottava da 125 Hz a 8 KHz. I microfoni con una risposta piatta POTREBBERO essere corretti tramite filtri, che devono essere lineari e non nel tempo.
1.5 Segnale di ingresso
Il segnale di ingresso all'applicazione vocale dal microfono deve soddisfare i seguenti requisiti:
- Devi configurare il parametro di sensibilità del microfono con precisione in base alle letture calibrate del microfono.
- Registra la risposta in frequenza del microfono DUT durante la riproduzione del segnale dall'altoparlante di riferimento calibrato.
- Il segnale in ingresso ai microfoni è 94 dB SPL.
- A 16 KHz, 24-32 bit di profondità, segnale di ingresso per l'applicazione vocale: entro +/- 3dB di un RMS di sensibilità del microfono.
1.6. Profondità di bit
La profondità in bit del segnale vocale del microfono non deve essere inferiore a 16 bit.