会話データのアップロード

スマート リプライは、会話データを入力として受け取り、そのデータを使用してカスタム レスポンスの候補モデルをトレーニングします。必要に応じて、Agent Assist 提供の会話データを使用して、独自のデータを提供しなくても機能または統合をテストできます。ランタイムにスマート リプライを使用するには、独自の会話データを指定する必要があります。

このページでは、既存のデータセットの使用方法と、Cloud Storage にアップロードする独自のデータをフォーマットする手順を説明します。会話データは JSON 形式のテキスト ファイルとして指定する必要があります。

Agent Assist によって提供される会話データを使用(省略可)

Agent Assist は、一般公開されている会話データと、そのデータでトレーニングされたモデルと許可リストを提供します。これらのリソースを使用すると、独自のデータを提供しなくても、会話プロファイルを作成して機能をテストできます。このオプションを使用する場合は、会話プロファイルのチュートリアルに移動し、次のリソースを使用して会話プロファイルを作成します。

提供された会話データセットは、外部ソースから派生し、Google Cloud Storage バケット(gs://smart_messaging_integration_test_data)に保存されます。データには、「予約」、「レストラン」、「ホテル」、「アトラクション」、「タクシー」、「トレーニング」の 6 つのドメインに触れるタスク指向のダイアログが含まれています。このデータおよび関連する許可リストを使用してトレーニングされたモデルは、次の場所にあります。

  • モデル: projects/ccai-shared-external/conversationModels/c671dd72c5e4656f
  • 許可リスト: projects/ccai-shared-external/knowledgeBases/smart_messaging_kb/documents/NzU1MDYzOTkxNzU0MjQwODE5Mg

機能をテストするには、次のエンドユーザー メッセージを使用してレスポンスをトリガーすることをおすすめします。

  • 「東の方に、安く宿泊できる場所はないでしょうか?」
  • 「タイの料理を提供する高価なレストランを探しています。」
  • 「ケンブリッジの北のほうで、無料 Wi-Fi があるホテルを探しています。」

会話の音声文字変換データ

テキスト会話データは JSON 形式のファイルで指定する必要があります。各ファイルには 1 つの会話のデータが含まれています。必須の JSON 形式は次のとおりです。

会話

会話データの最上位オブジェクト。

項目 タイプ 説明
conversation_info ConversationInfo { } 省略可。会話のメタデータ。
entries エントリ [ ] 必須。時系列に並べられた会話メッセージ。

ConversationInfo

会話のメタデータ。

項目 タイプ 説明
categories カテゴリ [ ] 省略可。会話データのカスタム カテゴリ。

カテゴリ

会話データカテゴリ。会話データで指定したカテゴリは、会話内のトピックの識別に使用されます。カテゴリを指定しない場合は、コンテンツに基づいて会話が自動的に分類されます。

項目 タイプ 説明
display_name 文字列 必須。カテゴリの表示名。

エントリ

1 つの会話メッセージのデータ。

項目 タイプ 説明
テキスト 文字列 必須。この会話メッセージのテキスト。テキストはすべて大文字にする必要があります。モデルの品質は、テキスト内のすべての文字が大文字または小文字のいずれかである場合に大幅に影響を受ける可能性があります。このフィールドを空のままにすると、エラーが返されます。
user_id 整数 省略可。会話の参加者を識別する番号です。参加者ごとに 1 つの user_id が必要です。複数の会話に参加する場合は、この ID を繰り返し使用します。
役割 文字列 必須。会話の参加者のロール。「AGENT」、「CUSTOMER」のいずれか。
start_timestamp_usec 整数 必須。この会話の開始のタイムスタンプがマイクロ秒単位で表示されます。

会話データファイルの例を次に示します。

{
  "conversation_info":{
    "categories":[
      {
        "display_name":"Category 1"
      }
    ]
  },
  "entries": [
    {
      "start_timestamp_usec": 1000000,
      "text": "Hello, I'm calling in regards to ...",
      "role": "CUSTOMER",
      "user_id": 1
    },
    {
      "start_timestamp_usec": 5000000,
      "text": "Yes, I can answer your question ...",
      "role": "AGENT",
      "user_id": 2
    },
    ...
  ]
}

Cloud Storage に会話をアップロード

会話データは GCP プロジェクトに含まれている Cloud Storage バケットで指定する必要があります。 バケットを作成する場合は、次のようにします。

  • Dialogflow で使用する GCP プロジェクトが選択されていることを確認します。
  • Standard Storage クラスを使用します。
  • バケットのロケーションを現在地に最も近い場所に設定します。会話データを提供する場合はロケーション ID(例: us-west1)が必要となるため、選択した ID をメモしておきます。
  • 会話データを提供するときにもバケット名が必要です。

Cloud ストレージ クイックスタートの手順に沿って、バケットを作成し、ファイルをアップロードします。