エージェントの設定

エージェントには、動作に影響する多くの設定があります。コンソールごとに設定が異なります。

Dialogflow CX コンソールのエージェント設定

エージェントの構成にアクセスするには、以下の手順に従います。

コンソール

  1. Dialogflow CX コンソールを開きます。
  2. ご自身の Google Cloud プロジェクトを選択します。
  3. エージェントを選択します。
  4. [エージェント設定] をクリックします。
  5. 必要に応じて設定を更新します。
  6. [保存] をクリックします。

API

Agent 型の get メソッドと patch/update メソッドをご覧ください。

エージェント リファレンスのプロトコルとバージョンを選択:

プロトコル V3 V3beta1
REST エージェント リソース エージェント リソース
RPC エージェント インターフェース エージェント インターフェース
C++ AgentsClient 利用できません
C# AgentsClient 利用できません
Go AgentsClient 利用できません
Java AgentsClient AgentsClient
Node.js AgentsClient AgentsClient
PHP 利用不可 利用できません
Python AgentsClient AgentsClient
Ruby 利用不可 利用できません

以下では、エージェント設定の各カテゴリについて説明します。

全般設定

エージェントでは次の全般設定を使用できます。

  • 表示名

    人間が読み取れる形式のエージェントの名前。

  • タイムゾーン

    エージェントのデフォルトのタイムゾーン。

  • デフォルトの言語

    エージェントがサポートするデフォルトの言語。 エージェントの作成後に、デフォルトの言語を変更することはできません。ただし、次のことはできます。

    1. エージェントを JSON 形式エクスポートします。
    2. ダウンロードしたファイルを解凍します。
    3. agent.json ファイルを見つけます。
    4. defaultLanguageCode フィールドと supportedLanguageCodes フィールドを必要な値に更新します。
    5. ステップ 1 と同じエージェントまたは別のエージェントにエージェントを復元します。
    6. 必要に応じて、言語固有のトレーニング フレーズとエンティティ値を更新します。
  • エージェント ロック

    • エージェントをロックする

      エージェントがロックされているかどうかを示します。ロックされたエージェントは編集できません。

  • ロギングの設定

    • Cloud Logging を有効にする

      エージェントで Cloud Logging が有効になっているかどうかを示します。

    • インタラクションのロギングを有効にする

      品質向上のために秘匿化済みエンドユーザー クエリを収集して保存するかどうかを指定します。

    • 同意に基づくエンドユーザー入力の秘匿化を有効にする

      この設定を有効にすると、特別なセッション パラメータを使用して、会話履歴Cloud Loggingからのエンドユーザー入力とパラメータを秘匿化するかどうかを制御できます。デフォルトでは、セッション パラメータは true です。この設定が無効になっている場合、秘匿化は行われません。

      ユーザーの同意は、ブール値のセッション パラメータ $session.params.conversation-redaction を使用して収集されます。この設定が有効になっていて、セッション パラメータが false に設定されている場合、秘匿化は行われません(他の秘匿化戦略は引き続き適用されます)。この設定が有効になっていて、セッション パラメータが true に設定されている場合、秘匿化は行われます。

      同意を求める流れの例を挙げると、まずエンドユーザー入力を保持するかどうかをユーザーに尋ねて、そのレスポンスを 2 つのインテントと照合します。1 つ目は「はいのインテント」、もう 1 つは「いいえのインテント」です。次に、フルフィルメントの「はいのインテント」のルートにあるパラメータ プリセットで、セッション パラメータを false(秘匿化しない)に設定します。また、「いいえのインテント」のルートにあるパラメータ プリセットで、セッション パラメータを true(秘匿化する)に設定します。

  • BigQuery へのエクスポート

    • BigQuery エクスポートを有効にする

      BigQuery Export が有効になっているかどうかを示します。

    • BigQuery データセット

      BigQuery データセット名。

    • BigQuery テーブル

      BigQuery テーブル名。

  • インテントの候補

    インテントの候補を有効にできます。

  • カスタム ペイロード テンプレート

    このセクションでは、カスタム ペイロード テンプレートの説明とペイロードを作成できます。

ML の設定

会話エージェント(Dialogflow CX)は、機械学習(ML)アルゴリズムを使用して、エンドユーザー入力を理解し、インテントと照合して、構造化データを抽出します。会話エージェント(Dialogflow CX)は、ユーザーが提供するトレーニング フレーズと、会話エージェント(Dialogflow CX)に組み込まれた言語モデルから学習します。このデータに基づいて、エンドユーザー入力と照合するインテントを決定するモデルを構築します。エージェントのフローごとに一意の ML 設定を適用できます。会話エージェント(Dialogflow CX)によって作成されたモデルは、フローごとに一意です。

次のエージェント全体の ML 設定が使用できます。

  • ML にスペルの修正を許可する

    これを有効にすると、エンドユーザーの入力にスペルミスや文法ミスがあっても、入力が正しく記述されているものとしてインテントと照合されます。インテント検出レスポンスには、修正済みのエンドユーザー入力が含まれます。たとえば、エンドユーザーが「I want an applle」と入力した場合、「I want an apple」と入力したかのように処理されます。これは、システム エンティティとカスタム エンティティの両方を含むマッチングにも当てはまります。

    スペル修正は、英語、フランス語、ドイツ語、スペイン語、イタリア語で利用できます。すべての会話エージェント(Dialogflow CX)のリージョンで利用できます。

    警告とおすすめの方法:

    • スペル修正では ASR(自動音声認識)エラーを修正できないため、ASR 入力を使用しているエージェントではこれを有効にしないことをおすすめします。
    • 修正された入力が誤ったインテントと一致する可能性があります。これを修正するには、誤ってインテントに一致することがよくあるフレーズをに追加します。
    • スペルの修正により、エージェントのレスポンス時間がわずかに増加します。
    • エージェントがドメイン固有の専門用語を使用して定義されている場合、修正が望ましくない場合があります。

次のフロー固有の ML 設定が利用できます。

  • NLU タイプ

    次のいずれかになります。

  • 自動トレーニング

    有効にすると、フローがコンソールで更新されるたびにトレーニングされます。フローが大きい場合、コンソール UI の遅延の原因となることがあります。その場合はこの設定を無効にし、必要に応じて大規模なフロー用に手動でトレーニングする必要があります。

  • 分類しきい値

    結果から偽陽性を除外した後でも、多様な自然言語入力との一致に基づいてエージェントが応答できるように、ML の分類しきい値を調整できます。この設定は、インテントの一致に必要なインテント検出の信頼度を制御します。

    インテント一致の信頼スコアがしきい値より小さい場合は、no-match イベントが呼び出されます。

    エージェントで有効になっている各言語のフローごとに、個別の分類しきい値を設定できます。これは、さまざまな分類しきい値で最高のパフォーマンスを発揮するさまざまな言語に対応するためです。多言語エージェントの作成の詳細については、多言語エージェントに関するドキュメントをご覧ください。

  • トレーニングのステータス

    フローデータの最新更新以降にフローがトレーニングされたかどうかを示します。

  • NLU のトレーニング

    フローを手動でトレーニングする場合は、このボタンを使用します。

生成 AI の設定

次の生成 AI 設定が利用できます。

  • 全般

    • 禁止フレーズ

      生成 AI で禁止されているフレーズのリスト。禁止されたフレーズがプロンプトまたは生成されたレスポンスにある場合、生成は失敗します。

    • 安全フィルタ

      責任ある AI(RAI)の各カテゴリに対して安全フィルタの感度レベルを構成します。コンテンツは、次の 4 つのカテゴリで評価されます。

      カテゴリ 説明
      ヘイトスピーチ ID や保護されている属性をターゲットとする否定的なコメントや有害なコメント。
      危険なコンテンツ 有害な商品、サービス、アクティビティへのアクセスを促進または可能にする
      性的描写が露骨なコンテンツ 性行為やわいせつな内容に関する情報が含まれるコンテンツ
      嫌がらせ 他人をターゲットにした悪口、威圧表現、いじめ、虐待的な内容を含むコメント

      コンテンツは有害である可能性に基づいてブロックされます。 各カテゴリの感度レベルは、[少量をブロック]、[一部をブロック]、[ほとんどをブロック] のいずれかを選択してカスタマイズできます。また、プロジェクトのリスク認識リクエストを送信して承認を受けた後、カテゴリの RAI チェックを無効にする [ブロックなし] 制限付きオプションを利用することもできます。

      詳細については、安全性属性を構成するをご覧ください。

    • プロンプトのセキュリティ

      [enable prompt security check] 設定をオンにすると、プロンプトによるセキュリティ チェックを有効にできます。有効にすると、エージェントはプロンプト インジェクション攻撃を防ぐよう試みます。これらの攻撃は、エージェント プロンプトの一部を明らかにしたり、エージェントが提供すべきでないレスポンスを提供したりするために使用される場合があります。これは、ユーザーのクエリが悪意のあるものであるかどうかを確認する追加の LLM プロンプトを送信することで実現されます。

  • 生成エージェント

    • 生成モデルの選択

      生成機能で使用するモデルを選択します。詳細については、モデルのバージョンをご覧ください。

    • Playbook コンテキストの切り捨て

      Playbook コンテキストの切り捨てでは、Playbook プロンプトから過去のターンの一部を削除して、Playbook によって処理される連続ターンごとにプロンプトのサイズが大きくなるのを防ぎます。この機能を使用すると、不要なプロンプトサイズの増加を軽減できます。

      通常、切り捨てなしの場合、後続の各ターンは、現在のターンに関連しているかどうかに関係なく、LLM プロンプトの「会話履歴」に追加されます。これにより、最終的にはターンごとにプロンプトのサイズが大きくなる可能性があります。会話履歴によってプロンプトの使用量が増えると、少数ショットのサンプルに使用できるプロンプトの量が減ります(そのため、少数ショットのサンプルが破棄される可能性があります)。最終的には、プロンプトが現在のトークン上限を超える可能性があります。これに応じてトークンサイズを増やすことはできますが、プロンプトサイズの増加は LLM レスポンスのレイテンシの増加にもつながることを念頭に置いてください。

      Playbook コンテキストの切り捨てでは、会話履歴に予約するトークン バジェットの割合を最大値として設定できます。会話のターンは、最新の順に保存されます。この設定により、トークンの上限を超えないようにできます。どの設定を選択しても、少なくとも 2 つの会話ターンが最新から古い順に保持されます。

      この設定を変更するには、まずトークン数の上限を設定する必要があります。

      重要: コンテキストを切り捨てると、除外されたターンの一部である一部のパラメータが誤って失われる可能性があります。このオプションを有効にした後、Playbook のインタラクションを慎重に評価してください。

      トークン入力予算は、次のものでも使用されます。

      • システムの指示と例: プロンプトに自動的に追加されます。この動作は変更できません。
      • ハンドブックの指示と目標: 作成した指示と目標はすべて、プロンプトに追加されます。
      • ハンドブックの少数ショットの例: 順番(デフォルト)で追加されるか、選択したアルゴリズム(正規表現の最適な一致順序など)で追加されます。他のすべてのアイテムが追加された後、入力トークン バジェット内に収まるように例が除外されます。
      • ユーザーとエージェントの発話、フローおよびプレイブックの遷移コンテキスト、現在のプレイブックで順番に処理された以前のすべてのターンの同じセッション内のツール呼び出しと出力で構成される会話履歴。
  • 生成フォールバック

  • データストア

    データストア エージェントの設定をご覧ください。

音声と IVR の設定

次の音声と IVR の設定を使用できます。

  • Text-to-Speech

    • 音声の選択

      音声合成に使用する言語と音声を選択できます。

      音声選択ドロップボックスからカスタム音声オプションを選択し、対応するフィールドにカスタム音声名を指定することで、エージェントのカスタム音声を有効にできます。カスタム音声名は、projects/PROJECT_ID/locations/LOCATION/models/MODEL_NAME のパターンに従う必要があります。

      • テレフォニー ゲートウェイを使用している場合は、Dialogflow サービス エージェントのサービス アカウント service-PROJECT_NUMBER@gcp-sa-dialogflow.iam.gserviceaccount.com にカスタム音声プロジェクトにおける「AutoML Predictor」が付与されていることを確認します。
      • 通常の API 呼び出しの場合は、会話エージェント(Dialogflow CX)の呼び出しに使用するサービス アカウントに、カスタム音声プロジェクトにおける「AutoML Predictor」ロールが付与されていることを確認します。
  • Speech-to-Text

DTMF

詳しくは、テレフォニー統合用の DTMF をご覧ください。

マルチモーダル

コンパニオンの呼び出しをご覧ください。

共有設定

アクセス制御をご覧ください。

言語設定

エージェントに追加の言語サポートを追加します。全言語の一覧については、言語リファレンスをご覧ください。

言語の自動検出

言語の自動検出を構成すると、チャット エージェントはエンドユーザーの言語を自動的に検出してその言語に切り替わります。詳細については、言語の自動検出のドキュメントをご覧ください。

セキュリティ設定

セキュリティ設定をご覧ください。

詳細設定

現在、詳細設定は感情分析でのみ利用できます。

Agent Builder コンソールの設定

このセクションでは、エージェント アプリで使用できる設定について説明します。

全般

エージェント アプリでは次の全般設定を使用できます。

  • 表示名

    人間が読み取れる形式のエージェントアプリの名前。

  • ロケーション

    エージェント アプリのリージョン。

  • アプリのロック

    有効にすると、エージェント アプリへの変更は許可されません。

ロギング

エージェント アプリでは、次のロギング設定を使用できます。

  • Cloud Logging を有効にする

    有効にすると、ログは Cloud Logging に送信されます。

  • 会話履歴を有効にする

    有効にすると、会話履歴が利用可能になります。品質向上のために秘匿化済みエンドユーザー クエリを収集して保存するかどうかを指定します。この設定は、会話履歴がエージェント レスポンスの生成に使用されるかどうかには影響しません。

  • BigQuery エクスポートを有効にする

    有効にすると、会話履歴が BigQuery にエクスポートされます。[会話履歴を有効にする] の設定も有効にする必要があります。

生成 AI

エージェント アプリでは、次の生成 AI 設定を使用できます。

  • 生成モデルの選択

    エージェントがデフォルトで使用する生成モデルを選択します。

  • 入力トークンの上限

    生成モデルの入力トークン上限を選択します。これは、モデルに送信される入力のトークンサイズの上限です。モデルによって、トークンは 1 文字から 1 単語の範囲になります。トークンの上限が小さいほどレイテンシは低くなりますが、モデル入力サイズは制限されます。トークン数の上限を大きくするとレイテンシは高くなりますが、モデル入力サイズを大きくできます。

  • 出力トークンの上限

    生成モデルの出力トークンの上限を選択します。これは、モデルから受信する出力の最大トークンサイズです。モデルによって、トークンは 1 文字から 1 単語の範囲になります。トークン数の上限が小さいほどレイテンシは低くなりますが、モデルの出力サイズは制限されます。トークン数の上限を大きくするとレイテンシは高くなりますが、モデルの出力サイズは大きくなります。

  • 温度

    LLM の温度により、レスポンスの創造性を制御できます。値が小さいほど、より予測可能なレスポンスが返されます。値が大きいほど、より創造的なレスポンスまたはランダムなレスポンスが返されます。

  • 禁止フレーズ

    生成 AI で禁止されているフレーズのリスト。禁止されたフレーズがプロンプトまたは生成されたレスポンスにある場合、エージェントは代わりに代替レスポンスを返します。

  • 安全フィルタ

    責任ある AI(RAI)の各カテゴリに対して安全フィルタの感度レベルを構成します。コンテンツは、次の 4 つのカテゴリで評価されます。

    カテゴリ 説明
    ヘイトスピーチ ID や保護されている属性をターゲットとする否定的なコメントや有害なコメント。
    危険なコンテンツ 有害な商品、サービス、アクティビティへのアクセスを促進または可能にする
    性的描写が露骨なコンテンツ 性行為やわいせつな内容に関する情報が含まれるコンテンツ
    嫌がらせ 他人をターゲットにした悪口、威圧表現、いじめ、虐待的な内容を含むコメント

    コンテンツは有害である可能性に基づいてブロックされます。 各カテゴリの感度レベルは、[少量をブロック](有害なコンテンツの確率が高いインスタンスのみをブロック)、[一部をブロック](確率が中程度または高いインスタンス)、[ほとんどをブロック](確率が低い、中程度、高い)のいずれかを選択してカスタマイズできます。また、プロジェクトのリスク認識リクエストを送信して承認を受けた後、カテゴリの RAI チェックを無効にする [ブロックなし] 制限付きオプションも利用できます。

    詳細については、安全性属性を構成するをご覧ください。

  • プロンプトのセキュリティ

    [enable prompt security check] 設定をオンにすると、プロンプトによるセキュリティ チェックを有効にできます。有効にすると、エージェントはプロンプト インジェクション攻撃を防ぐよう試みます。これらの攻撃は、エージェント プロンプトの一部を明らかにしたり、エージェントが提供すべきでないレスポンスを提供したりするために使用される場合があります。これは、ユーザーのクエリが悪意のあるものであるかどうかを確認する追加の LLM プロンプトを送信することで実現されます。

Git

これらの設定により、Git の統合が実現します。手順に沿ってインテグレーションを構成します。