Penempatan mikrofon

Bagian ini mencantumkan spesifikasi minimum untuk mikrofon dan sistem audio dalam penerapan Ucapan. Mikrofon menentukan performa library Ucapan.

1.1. Jumlah dan penempatan

  • Harus ada minimal satu mikrofon yang menghadap ke pengguna.
  • (Disarankan) Dua mikrofon dengan spasi tengah ke tengah (66 mm dan 71 mm) pada permukaan datar yang menghadap ke pengguna.
  • Tempatkan jauh dari sumber suara untuk meminimalkan pengaitan audio antara mikrofon dan speaker.

1.2. Pra-pemrosesan audio

  • Harus menyediakan akses aplikasi ucapan ke sinyal mikrofon mentah.
  • Jangan melakukan pemrosesan varian waktu atau non-linear pada audio.
  • (Direkomendasikan) Jangan lakukan beamforming, teknik kombinasi mikrofon lainnya, atau pra-pemrosesan audio lainnya pada sinyal audio yang disediakan untuk aplikasi ucapan.

1.3. Frekuensi Sampel

implementasi harus menggunakan frekuensi sampling mikrofon 16 KHz.

1.4. Performa Input

Mikrofon:

  • Harus dapat menangkap suara pada 94 dB SPL tanpa saturasi.
  • Harus mampu menangkap suara standar di area linear sensitivitas mikrofon.
  • Harus memiliki Acoustic Overload Points (AOP) yang minimal 10 dB lebih keras dari input yang dihasilkan speaker ke mikrofon antara 125 Hz dan 8 KHz. Dalam pengujian Google, mikrofon digital dengan AOP di atas 130 dB memiliki performa yang baik.
  • Harus memiliki Total Harmonic Distortion (THD) sebesar 1% atau kurang untuk sinyal SPL 94 dB antara 100 Hz dan 8 KHz.
  • Respons frekuensi mikrofon harus datar, +/- 3dB, diukur dalam 1/1 oktaf dari 125 Hz hingga 8 KHz. Mikrofon yang mencapai respons datar DAPAT dikoreksi melalui filter, yang harus linear dan waktunya invarian.

1.5. Sinyal Input

Sinyal input ke aplikasi ucapan dari mikrofon harus memenuhi persyaratan berikut:

  • Harus mengonfigurasi parameter sensitivitas mikrofon secara akurat berdasarkan pembacaan mikrofon yang dikalibrasi.
    • Rekam respons frekuensi mikrofon DUT saat memutar sinyal dari speaker referensi yang dikalibrasi.
    • Sinyal input ke mikrofon adalah 94 dB SPL.
    • Pada 16KHz, kedalaman 24-32 bit, sinyal input ke aplikasi ucapan: dalam +/- 3dB pada RMS sensitivitas mikrofon.

1.6. Kedalaman Bit

Kedalaman bit sinyal ke ucapan mikrofon tidak boleh kurang dari 16 bit.