您的代理经过训练后,Dialogflow 会使用您的训练数据专门该代理构建机器学习模型。通常,您可以通过直接向意图输入训练短语来提供训练数据。您还可以使用训练工具来分析、导入和导出实际对话数据,以及改进训练数据。
执行训练
默认情况下,每次保存代理时,系统都会自动执行训练。保存代理后,系统将显示对话框窗口来指示训练状态。您应该始终等到训练完成后再测试代理。
如果您的代理具有 780 个以上的意图,或者您已停用自动训练设置,则必须手动执行训练:
- 转到 Dialogflow ES 控制台。
- 在左侧边栏菜单顶部附近选择您的代理。
- 点击代理名称旁边的设置 settings 按钮。
- 点击机器学习设置 (ML Settings) 标签页。
- 点击页面底部的训练按钮。
如需使用 API 执行训练,请对代理类型调用 train
方法。
训练工具
训练工具用于查看代理与最终用户进行的对话,以及改进您的训练数据。使用此工具,您可以执行以下操作:
- 查看实际对话以及为每轮对话匹配的意图。
- 将这些对话中的最终用户表述添加到最初匹配的意图、不同的意图或后备意图的训练短语中。
- 导入您通过实际对话准备或捕获的对话数据。
该工具使用代理历史记录数据来加载对话,因此必须启用日志记录才能使用该工具。训练工具仅显示最终用户表述。如需查看代理和最终用户对话数据,请参阅更完整的代理历史记录。
如需打开训练工具,请执行以下操作:
- 转到 Dialogflow ES 控制台。
- 在左侧边栏菜单顶部附近选择您的代理。
- 点击左侧边栏菜单中的训练。
对话列表
当您打开该工具时,它会显示对话列表。这是按时间倒序排列的近期对话列表。该列表中的每行都提供了对话摘要。
下表介绍了每个界面元素:
界面元素 | 说明 |
---|---|
对话 | 对话中的第一句最终用户表述。 |
请求数 | 对话中的对话回合数。 |
无匹配 | 没有意图匹配的对话回合数。 |
日期 | 对话发生或导入的日期。 |
refresh | 将某一对话用于更新训练数据(如下所述)时,该行的状态指示器会显示一个绿色对勾标记。 |
训练视图
点击对话列表中的某行后,系统会在训练视图中打开相应对话。训练视图会显示对话回合列表,并提供用于将这些数据添加到训练数据中的控制措施。
在修改显示的数据或点击右侧的任务按钮时,您将创建排队等待保存的训练数据更新任务。完成任务创建后,点击批准按钮,以执行所有加入队列的任务并更新代理的模型。
下表介绍了每个界面元素:
界面元素 | 说明 |
---|---|
日期 | 对话发生或导入的日期。 |
请求数 | 会话的行数。 |
无匹配 | 没有意图匹配的行数。 |
用户表述 | 行的最终用户表述。 |
意图 | 对话发生时与此行匹配的意图。您可以点击链接,将关联的意图更改为新的或现有的意图。 |
check | 将任务加入队列,以将行的最终用户表述作为训练短语添加到当前选定的意图中。当任务加入队列时,图标会变为绿色。 |
block | 将任务加入队列,以将行的最终用户表述作为训练短语添加到默认后备意图中。这将创建一个反例。当任务加入队列时,图标会变为橙色。 |
delete | 将任务加入队列,以删除行。当任务加入队列时,图标会变为红色。 |
批准 | 针对所有行执行已加入队列的任务。 |
注释
在训练视图中查看对话时,最终用户表述会将匹配的实体显示为突出显示的注释。如需添加或修改注释,请执行以下操作:
- 点击相应注释或选择要添加注释的字词。
- 从菜单中选择现有实体。
导入对话
您可以将已准备或捕获的对话数据文件导入训练工具。导入对话可用于改进现有代理。如需上传会话,请点击页面顶部的上传按钮。然后,您可以分析此数据以添加到训练数据中(如上所述)。
下面介绍了文件内容格式、其限制和结果:
- 每个上传的文件都会在训练工具中生成一个对话。
- 请求不会发送到检测意图 API,因此不会激活任何上下文,也不会匹配任何意图。
- 单个文本文件或 zip 归档文件(最多可包含 10 个文本文件)。
- 一次上传大小不得超过 3 MB。
- 这些文件应仅包含以换行符分隔的最终用户表述。
- 理想情况下,文件应仅包含可用作训练短语的数据。
- 最终用户表述的顺序并不重要。
下面是一个示例文件:
I want information about my account. What is my checking account balance? How do I transfer money to my savings account?
最佳做法
在开发的各个阶段都使用训练工具
在代理开发的各个阶段都使用训练工具,并在每个阶段优化训练数据:
- 在将代理发布到生产环境之前,先向一小部分用户进行测试。
- 在将代理发布到生产环境后不久,检查实际对话是否按预期运行。
- 每当对代理进行重大更改时,请检查新更改是否按预期运行。
- 定期针对生产环境中的代理运行该工具,以执行常规分析。
导入质量数据
以下内容通常可以作为有用的数据来源:
- 客户与客服人员的对话日志。
- 在线客户服务对话(电子邮件、论坛、常见问题解答)。
- 客户在社交媒体上咨询的问题。
您应该避免以下类型的数据:
- 较长形式的非对话型最终用户表述。
- 与代理中的任何意图无关的最终用户表述。
- 非最终用户话语的日志(例如,客服人员的回复)。