マイクの配置

このセクションでは、Speech の実装でのマイクとオーディオ システムの最小仕様について説明示します。マイクによって Speech ライブラリのパフォーマンスが決まります。

1.1. 数と場所

  • ユーザーに向けたマイクが 1 つ以上必要です。
  • (推奨)平らな面の上にユーザーに向けて 2 本のマイクを置き、中心間距離を 66 mm と 71 mm にします。
  • マイクと話者の間の音響結合を最小限にするため、音源から話して配置します。

1.2. 音声の前処理

  • 音声アプリケーションに、生のマイク信号へのアクセス権を付与する必要があります。
  • 音声に対して時間変化処理または非線形処理を実行しないでください。
  • (推奨)音声アプリケーションに渡される音声信号に対して、ビームフォーミング、その他のマイク結合手法、その他の前処理を実行しないでください。

1.3. サンプリング レート

マイクのサンプリング レートは 16 KHz にする必要があります。

1.4. 入力パフォーマンス

マイク:

  • 飽和なしで 94 dB SPL で音声をキャプチャできる必要があります。
  • マイクの感度の線形領域で一般的な音声をキャプチャできる必要があります。
  • 音圧過負荷ポイント(AOP)は 125 Hz~8 KHz の間で、スピーカーで生成されたマイクへの入力から少なくとも 10 dB 大きくする必要があります。Google のテストでは、130 dB を超える AOP において、デジタルマイクで良好なパフォーマンスが得られました。
  • 100 Hz と 8 KHz の間の 94 dB SPL 信号の場合、全高調波歪み(THD)が 1% 以下である必要があります。
  • マイクの周波数応答は、125 Hz から 8 KHz の 1/1 オクターブで測定し、フラットで +/- 3dB である必要があります。フラットな応答を実現できるマイクは、フィルタを通して修正できますが、これは線形で、時不変である必要があります。

1.5. 入力信号

マイクから音声アプリケーションへの入力信号は、次の要件を満たしている必要があります。

  • マイクの調整された読み取り値に基づいて、マイクの感度パラメータを正確に構成する必要があります。
    • 調整された基準スピーカーからの信号を再生したときの DUT マイクの周波数応答を記録します。
    • マイクへの入力信号は 94 dB SPL です。
    • 16kHz で、24~32 ビット深度、音声アプリケーションへの入力信号: マイクの感度の RMS の +/- 3dB 以内。

1.6. ビット深度

音声にするマイク信号のビット深度は 16 ビット以上にする必要があります。