音声適応ブーストは、音声適応のオプションの機能です。ブーストでは、音声データ内で認識される頻度に従って、単語やフレーズに数値ウェイトを追加できます。
1)音声適応をすでに実装していて、2)音声文字変換の結果に対して音声適応効果の強度を調整する必要がある場合は、ブーストを実装することをおすすめします。
音声適応と音声適応ブーストのベスト プラクティスについて詳しくは、音声適応のコンセプトのページをご覧ください。
次のコードサンプルでは、音声適応ブーストを使用してリクエストを送信する方法を示しています。
REST
API エンドポイントの詳細については、speech:recognize
をご覧ください。
リクエストのデータを使用する前に、次のように置き換えます。
- language-code: 音声クリップで使用されている言語の BCP-47 コード。
- phrases-to-boost: Speech-to-Text で認識を強化したい語句で、文字列の配列。
- storage-bucket: Cloud Storage バケット。
- input-audio: 音声文字変換する音声データ。
HTTP メソッドと URL:
POST https://speech.googleapis.com/v1p1beta1/speech:recognize
JSON 本文のリクエスト:
{ "config":{ "languageCode":"language-code", "speechContexts":[{ "phrases":[phrases-to-boost], "boost": 2 }] }, "audio":{ "uri":"gs:storage-bucket/input-file" } }
リクエストを送信するには、次のいずれかのオプションを展開します。
次のような JSON レスポンスが返されます。
{ "results": [ { "alternatives": [ { "transcript": "When deciding whether to bring an umbrella, I consider the weather", "confidence": 0.9463943 } ], "languageCode": "en-us" } ] }
Java
Node.js
Python
次のステップ
- Speech-to-Text へのリクエストで音声適応を使用する方法を学習する。
- サポートされているクラストークンの一覧を確認する。