Penempatan mikrofon
Bagian ini mencantumkan spesifikasi minimum untuk mikrofon dan sistem audio dalam penerapan Ucapan. Mikrofon menentukan performa library Ucapan.
1.1. Jumlah dan penempatan
- Harus ada minimal satu mikrofon yang menghadap ke pengguna.
- (Disarankan) Dua mikrofon dengan spasi tengah ke tengah (66 mm dan 71 mm) pada permukaan datar yang menghadap ke pengguna.
- Tempatkan jauh dari sumber suara untuk meminimalkan pengaitan audio antara mikrofon dan speaker.
1.2. Pra-pemrosesan audio
- Harus menyediakan akses aplikasi ucapan ke sinyal mikrofon mentah.
- Jangan melakukan pemrosesan varian waktu atau non-linear pada audio.
- (Direkomendasikan) Jangan lakukan beamforming, teknik kombinasi mikrofon lainnya, atau pra-pemrosesan audio lainnya pada sinyal audio yang disediakan untuk aplikasi ucapan.
1.3. Frekuensi Sampel
implementasi harus menggunakan frekuensi sampling mikrofon 16 KHz.
1.4. Performa Input
Mikrofon:
- Harus dapat menangkap suara pada 94 dB SPL tanpa saturasi.
- Harus mampu menangkap suara standar di area linear sensitivitas mikrofon.
- Harus memiliki Acoustic Overload Points (AOP) yang minimal 10 dB lebih keras dari input yang dihasilkan speaker ke mikrofon antara 125 Hz dan 8 KHz. Dalam pengujian Google, mikrofon digital dengan AOP di atas 130 dB memiliki performa yang baik.
- Harus memiliki Total Harmonic Distortion (THD) sebesar 1% atau kurang untuk sinyal SPL 94 dB antara 100 Hz dan 8 KHz.
- Respons frekuensi mikrofon harus datar, +/- 3dB, diukur dalam 1/1 oktaf dari 125 Hz hingga 8 KHz. Mikrofon yang mencapai respons datar DAPAT dikoreksi melalui filter, yang harus linear dan waktunya invarian.
1.5. Sinyal Input
Sinyal input ke aplikasi ucapan dari mikrofon harus memenuhi persyaratan berikut:
- Harus mengonfigurasi parameter sensitivitas mikrofon secara akurat berdasarkan pembacaan mikrofon yang dikalibrasi.
- Rekam respons frekuensi mikrofon DUT saat memutar sinyal dari speaker referensi yang dikalibrasi.
- Sinyal input ke mikrofon adalah 94 dB SPL.
- Pada 16KHz, kedalaman 24-32 bit, sinyal input ke aplikasi ucapan: dalam +/- 3dB pada RMS sensitivitas mikrofon.
1.6. Kedalaman Bit
Kedalaman bit sinyal ke ucapan mikrofon tidak boleh kurang dari 16 bit.