本页面简要介绍了配置引擎背后的概念。
何时调谐或重新调谐
当您创建 EngineConfig 资源时,AML AI 会调整超参数。这是引擎针对任何引擎版本训练模型之前的必要步骤,因为在创建模型时必须指定引擎配置。
为获得最佳性能,出现以下任一情况时,您应考虑对引擎进行调整:
- 您将对数据集逻辑进行重大更改。例如,当发生以下任何变化时:
- 填充字段的逻辑
- 选择已填充的 RECOMMENDED 字段
- PartySupplementaryData 表中提供的数据的逻辑或选择
- 您将让引擎针对新区域训练模型。
如何调整引擎
如需触发调整,请参阅创建和管理引擎配置。
具体而言,您需要选择以下选项:
用于引擎调整的数据:
请在数据集的日期范围内指定数据集和结束时间。
引擎调整会根据截至所选结束时间所在月份的完整日历月使用标签和功能。如需了解详情,请参阅数据集时间范围。
用于引擎调整的引擎版本:
选择引擎版本,该版本与将要对其使用关联模型的业务范围(零售或商业)保持一致。
基于模型的预计调查量如下:
指定
partyInvestigationsPerPeriodHint
。这用于引擎调整、训练和回测,以确保 AML AI 能够在您的调查量范围内提供性能。
引擎调谐输出
引擎调整会生成 EngineConfig 资源,该资源可用于创建模型资源。
引擎配置元数据包含以下指标。具体而言,这些指标向您展示了以下内容:
与使用默认超参数相比,引擎调整带来的预期性能提升
数据集支持的特征系列的任何重大更改(在引擎调整、训练、评估和预测之间)
指标名称 | 指标说明 | 指标值示例 |
---|---|---|
expectedRecallPreTuning | 使用引擎版本的默认超参数时,在测试集上测量的召回率指标。
此召回率衡量假设 |
{ "recallValues": [ { "partyInvestigationsPerPeriod": 5000, "recallValue": 0.72, "scoreThreshold": 0.42, }, ], } |
expectedRecallPostTuning | 使用调谐超参数时,在测试集上测量的召回率指标。
此召回率衡量假设 |
{ "recallValues": [ { "partyInvestigationsPerPeriod": 5000, "recallValue": 0.80, "scoreThreshold": 0.43, }, ], } |
缺失 |
每个功能系列中所有特征的缺失值所占百分比。 理想情况下,所有 AML AI 特征系列的缺失值都应接近于 0。当这些功能系列的底层数据无法集成时,可能会发生例外情况。 如果此值在调整、训练、评估和预测之间出现任何特征系列的显著变化,则可能表示所用数据集存在不一致。 |
{ "featureFamilies": [ { "featureFamily": "unusual_wire_credit_activity", "missingnessValue": 0.00, }, ... ... { "featureFamily": "party_supplementary_data_id_3", "missingnessValue": 0.45, }, ], } |