一部のサービスと機能は名前を変更中です。生成ハンドブックとフロー機能も、単一の統合コンソールに移行されます。詳しくは、こちらをご覧ください。

このページは Cloud Translation API によって翻訳されました。

音声の詳細設定

このセクションでは、音声機能に関する追加の詳細設定について説明します。これらの詳細設定は、[エージェントの設定] > [音声と IVR] > [音声文字変換] > [音声の詳細設定] に移動して、オンオフを切り替えることができます。

これらの設定は、エージェントの設定（エージェント全体に適用されます）、フローの設定（フロー全体に適用され、エージェントの設定をオーバーライドします）、ページの設定（ページに適用され、フローとエージェントの設定をオーバーライドします）、フルフィルメントの設定（フルフィルメントに適用され、ページ、フロー、エージェントの設定をオーバーライドします）で利用できます。これらの設定のサブセットは、レベルの設定の関連性に応じて、各レベルで使用できます。*これらの設定を下位レベルで構成する前に、まずエージェントレベルで [音声の詳細設定を有効にする] チェックボックスをオンにする必要があります（[エージェントの設定] > [音声と IVR] > [音声文字変換] > [音声の詳細設定]）*。

[カスタマイズ] オプションが下位レベルで選択されている場合、更新されたエージェントレベルの設定は、フローレベル、ページレベル、フルフィルメントレベルに反映されません。[カスタマイズ] オプションが複数の設定を網羅していて、一部の設定だけを更新したい場合、他の設定をエージェントレベル設定と同じにする場合にそれらの設定を更新する必要もあります。

レベル別の設定の利用可否

次の表に、各レベルで利用可能な音声の詳細設定を示します。

設定名	エージェント	フロー	ページ	フルフィルメント
モデル選択（音声入力）	✔	✔	✔
音声終了の感度	✔	✔	✔
高度なタイムアウトベースの音声終了感度	✔	✔	✔
スマートエンドポイントを有効にする	✔
音声のタイムアウトなし	✔	✔	✔
割り込み	✔	✔		✔
部分的なレスポンスの再生をキャンセルできるようにする				✔
音声エクスポートバケット	✔	✔
DTMF	✔	✔	✔

モデル選択（音声入力）

エージェント、フロー、ページのレベルで設定できます。

音声認識に使用する音声モデルを設定します。この設定は言語固有であるため、言語ごとに異なるモデルを選択できます。[リクエストレベルの音声モデルをオーバーライドする] をオンにして、ランタイム API 呼び出しで別のモデルが指定されている場合でも、選択したモデルが使用されるように設定することもできます。

会話エージェント（Dialogflow CX）Phone Gateway については、制限事項をご覧ください。詳細については、音声モデルをご覧ください。

音声終了の感度

エージェント、フロー、ページのレベルで設定できます。

エンドユーザーの音声入力で音声の終わりを認識する感度を制御します。値の範囲は、0（低い感度で、音声を終了する可能性が低い）から 100（高い感度で、音声を終了する可能性が高い）です。

高度なタイムアウトベースの音声終了感度

エージェントレベルで設定し、フローレベルとページレベルで無効にできます。

この設定が有効になっている場合、[音声終了の感度] の設定値は、相対的な音声無音タイムアウトを確立して音声の終了を判断するためのゲージとして使用されます。この設定が無効になっている場合（デフォルト）、[音声終了の感度] の設定値を使用して、 Google Cloud Speech-to-Text 提供の ML モデルによって音声の終了が判別されます。

一方、[音声終了の感度] 設定のデフォルトで en-US 言語タグの phone_call 音声モデルのみがサポートされる場合、[高度なタイムアウトベースの音声終了感度を有効にする] 設定により、Dialogflow でサポートされているすべての言語と音声モデルに対して音声終了の感度を構成できます。

スマートエンドポイントを有効にする

エージェントレベルでのみ設定できます。

この設定が有効になっている場合、会話エージェント（Dialogflow CX）は部分的なユーザー入力を分析して、音声の終了を判断します。たとえば、ユーザーが「I would like to」と言って一時停止すると、会話エージェント（Dialogflow CX）はユーザーがその文を続行するのを待ちます。

これは、数値パラメータを収集する場合に特に便利で、ユーザーは「1234」と言って一時停止してから「5678」と言う場合があります。特定のパラメータにこの設定を適用するには、パラメータのフォームでスマートエンドポイントを設定する必要があります。

この設定は en-US 言語タグでのみ使用でき、デフォルトでは無効になっています。

音声のタイムアウトなし

エージェント、フロー、ページのレベルで設定できます。

会話エージェント（Dialogflow CX）がエンドユーザーの音声入力の待機を停止する時間（秒）。デフォルトは 5 秒で、最大値は 60 秒です。このタイムアウトに対して、会話エージェント（Dialogflow CX）は no-input イベントを呼び出します。

割り込み

エージェント、フロー、フルフィルメントのレベルで設定できます。

有効にすると、エンドユーザーは会話エージェント（Dialogflow CX）のレスポンス音声を中断できます。中断されると、会話エージェント（Dialogflow CX）は音声の送信を停止し、次のエンドユーザー入力を処理します。

メッセージキューに複数のメッセージがあり、割り込みが有効なページ、フロー、エージェントに関連付けられたフルフィルメントによりメッセージがキューに登録された場合、キュー内の後続のメッセージすべてに割り込みが有効になります。この場合、統合により割り込みが有効になっているキュー内のすべてのメッセージが再生されなくなります。

部分的なレスポンスの再生をキャンセルできるようにする

フルフィルメントレベルでのみ設定できます。

この設定は、[エージェントの設定] > [音声と IVR] で音声の詳細設定を有効にするボックスがオンになっていて、フルフィルメントレベルで部分的なレスポンスが有効になっている場合に有効にできます。この設定により、部分的なレスポンスの再生をキャンセルできます。

キャンセルを許可するフルフィルメントによってメッセージキュー内のメッセージが作成された場合、別のメッセージがキューに追加されると、メッセージの再生がキャンセルされます。これは、最初のメッセージの再生を開始したいが、最初のメッセージの再生が完了する前に動作中の Webhook が別のメッセージを生成した場合、その再生をキャンセルするときに役立ちます。

音声エクスポートバケット

エージェントレベルとフローレベルで設定できます。

指定した場合、リクエストに関連付けられた音声データが Cloud Storage バケットに保存されます。

保存された音声	該当するリクエスト
エンドユーザーの音声入力	DetectIntent, StreamingDetectIntent, AnalyzeContent, StreamingAnalyzeContent
レスポンス用に合成されたテキスト読み上げ（TTS）音声	AnalyzeContent, StreamingAnalyzeContent

ストレージオブジェクト作成者ロールを、プロジェクト内の次のサービスアカウントに付与してください。

形式が「one-click@df-cx-ALPHANUMERIC_VALUE-ALPHANUMERIC_VALUE.iam.gserviceaccount.com」のサービスアカウント（パートナー組み込みのテレフォニー統合を使用する場合）。
Dialogflow CX Phone Gateway の統合を使用する場合、service-PROJECT_NUMBER@gcp-sa-dialogflow.iam.gserviceaccount.com 形式のサービスアカウント。IAM でこのサービスアカウントを見つけるには、[Google 提供のロール付与を含める] オプションをオンにします。

DTMF

この機能の詳細については、DTMF（デュアルトーン多重周波数信号）のドキュメントをご覧ください。

音声適応

2024 年第 1 四半期の音声モデルの移行

音声の詳細設定

レベル別の設定の利用可否

モデル選択（音声入力）

音声終了の感度

高度なタイムアウト ベースの音声終了感度

スマート エンドポイントを有効にする

音声のタイムアウトなし

割り込み

部分的なレスポンスの再生をキャンセルできるようにする

音声エクスポート バケット

DTMF

高度なタイムアウトベースの音声終了感度

スマートエンドポイントを有効にする

音声エクスポートバケット