上传对话数据

智能回复接受对话数据作为输入,并使用这些数据训练自定义响应建议模型。您可以选择性地使用 Agent Assist 提供的对话数据来测试功能或集成,而无需提供您自己的数据。为了在运行时使用智能回复,您必须提供自己的对话数据。

本页面将指导您使用预先存在的数据集并设置数据格式以上传到 Cloud Storage。您必须以 JSON 格式的文本文件形式提供对话数据。

使用 Agent Assist 提供的对话数据(可选)

Agent Assist 提供了公开提供的对话数据以及基于这些数据训练的模型和许可名单。您可以使用这些资源来创建对话配置文件并测试功能,而无需提供自己的数据。如果您想使用此选项,可以转到对话配置文件教程,然后使用以下资源创建对话配置文件。

提供的对话数据集派生自外部来源,并存储在 Google Cloud Storage 存储桶中:gs://smart_messaging_integration_test_data。数据包含涉及六个领域的面向任务的对话:“预订”、“餐厅”、“酒店”、“景点”、“出租车”和“火车”。可以在以下位置找到使用此数据训练的模型及其关联的许可名单:

  • 模型:projects/ccai-shared-external/conversationModels/c671dd72c5e4656f
  • 许可名单:projects/ccai-shared-external/knowledgeBases/smart_messaging_kb/documents/NzU1MDYzOTkxNzU0MjQwODE5Mg

如需测试功能,我们建议您首先使用以下最终用户消息来触发响应:

  • “您能找到一个位于东部比较贵的住宿地点吗?”
  • “我正在寻找一家比较贵的餐厅,供应泰国食物。”
  • “您好,我需要一家酒店,在剑桥以北,可提供免费 Wi-Fi。”

对话转录数据

文本会话数据必须以 JSON 格式文件提供,其中每个文件包含单个对话的数据。下文介绍了必需的 JSON 格式。

对话

对话数据的顶级对象。

字段 类型 说明
conversation_info ConversationInfo { } 可选。对话的元数据。
entries Entry [ ] 必需。按时间顺序排序的对话消息。

ConversationInfo

对话的元数据。

字段 类型 说明
类别 Category [ ] 可选。对话数据的自定义类别。

类别

对话数据类别。如果您提供包含对话数据的类别,则这些类别将用于标识对话中的主题。如果您没有提供类别,系统将根据内容自动对对话进行分类。

字段 类型 说明
display_name 字符串 必需。类别的显示名。

条目

单个对话消息的数据。

字段 类型 说明
text 字符串 必需。此对话消息的文本。 所有文本都应大写。如果文本中的所有字母均为大写或小写,则模型质量可能会受到显著影响。如果此字段留空,将返回错误。
user_id 整数 可选。标识对话参与者的数字。每个参与者应该有一个 user_id,并在他们参与多个对话时重复使用。
角色 字符串 必需。对话参与者角色。“AGENT”或“CUSTOMER”之一。
start_timestamp_usec 整数 必需。此轮对话开始时的时间戳(以微秒为单位)。

示例

以下示例展示了对话数据文件。

{
  "conversation_info":{
    "categories":[
      {
        "display_name":"Category 1"
      }
    ]
  },
  "entries": [
    {
      "start_timestamp_usec": 1000000,
      "text": "Hello, I'm calling in regards to ...",
      "role": "CUSTOMER",
      "user_id": 1
    },
    {
      "start_timestamp_usec": 5000000,
      "text": "Yes, I can answer your question ...",
      "role": "AGENT",
      "user_id": 2
    },
    ...
  ]
}

将对话上传到 Cloud Storage

您必须在 GCP 项目包含的 Cloud Storage 存储桶中提供对话数据。创建存储桶时,请注意以下几点:

  • 务必选择用于 Dialogflow 的 GCP 项目。
  • 使用 Standard 存储类别
  • 存储分区位置设置为离您最近的位置。您在提供对话数据时需要使用位置 ID(例如 us-west1),因此请记下您的选择。
  • 在提供对话数据时,您还需要使用存储桶名称。

按照 Cloud Storage 快速入门中的说明创建存储分区并上传文件。