Emplacement du micro
Cette section liste les spécifications minimales du micro et du système audio dans une mise en œuvre de Speech. Le micro détermine les performances de la bibliothèque Speech.
1.1. Nombre et emplacement
- Au moins un micro doit être disposé face à l'utilisateur.
- (Recommandé) Deux micros disposés selon un entraxe défini (66 mm et 71 mm), sur une surface plane face à l'utilisateur.
- Éloignez les micros des sources audio pour limiter le couplage entre le micro et les haut-parleurs.
1.2. Prétraitement du flux audio
- L'application vocale doit pouvoir accéder au signal brut du micro.
- N'effectuez pas de traitement par variante temporelle ou de traitement non linéaire du flux audio.
- (Recommandé) N'appliquez pas de formation de faisceau (beamforming), ni d'autres techniques de combinaison de micro, ni d'autres prétraitements audio sur le signal audio fourni à l'application vocale.
1.3. Taux d'échantillonnage
Les mises en œuvre doivent utiliser un taux d'échantillonnage du micro de 16 kHz.
1.4. Performances en entrée
Le micro :
- doit pouvoir enregistrer du son à un niveau de pression acoustique de 94 dB, sans saturation ;
- doit être capable de capturer les sons classiques dans la région linéaire de la plage de sensibilité du micro ;
- doit comporter des points de surcharge acoustiques (AOP) au moins 10 dB plus élevés que l'entrée générée par le haut-parleur vers le micro, pour les fréquences comprises entre 125 Hz et 8 kHz. Lors des tests Google, les micros numériques avec un AOP supérieur à 130 dB se sont révélés performants ;
- doit présenter un taux de distorsion harmonique totale (THD) ne dépassant pas 1 %, pour un signal associé à un niveau de pression acoustique de 94 dB et compris entre 100 Hz et 8 kHz ;
- doit présenter une réponse en fréquence plate, de +/- 3 dB, mesurée par bande d'octaves entre 125 Hz et 8 kHz. Les micros susceptibles d'obtenir une réponse plate PEUVENT être corrigés via des filtres, qui doivent être linéaires et invariants dans le temps.
1.5. Signal d'entrée
Le signal d'entrée atteignant l'application vocale en provenance du micro doit répondre aux exigences suivantes :
- Il doit configurer précisément le paramètre de sensibilité du micro en fonction des relevés calibrés du micro.
- La réponse en fréquence du micro du dispositif en essai doit être enregistrée lors de la lecture du signal depuis le haut-parleur de référence calibré.
- Le signal d'entrée des micros respecte un niveau de pression acoustique de 94 dB.
- À 16 kHz, et pour une profondeur de 24 à 32 bits, le signal d'entrée atteignant l'application vocale se situe à +/- 3 dB de la valeur efficace de la sensibilité du micro.
1.6. Profondeur de bits
La profondeur de bits du signal du micro atteignant l'application vocale ne doit pas être inférieure à 16 bits.