配置引擎

本页面简要介绍了配置引擎背后的概念。

支持的超参数来源

在配置引擎时,您可以选择 用于创建模型的超参数。以下是 支持:

  • 自动调节:在发生以下情况时,AML AI 会调节超参数 创建 EngineConfig 资源(默认行为)
  • 继承:从之前的引擎配置继承超参数 使用同一调参版本中的早期引擎版本创建。 此设置可让您避免在每次采用新模型引擎时都进行重新调优 版本。

何时调整或继承

以下部分概述了何时应选择自动调参以及何时 应继承先前的引擎配置中的超参数。

调谐时间

您可以选择对每项新引擎配置进行调参,如有疑问, 应始终进行调整以获得最佳效果。查看章节 如需了解详情,请参阅如何调整引擎

为获得最佳效果,您应该考虑在以下任一时间 会发生以下情况:

  • 您对数据集逻辑进行了重大更改。例如,当任一 以下更改:
    • 填充字段所依据的逻辑
    • 选择填充的推荐字段
    • 提供的数据中的逻辑或 PartySupplementaryData
  • 您即将让引擎为新的区域训练模型。

何时继承超参数

如需在采用新引擎版本时节省时间和费用,您可以继承 使用相同调参版本的先前引擎中的超参数。查看章节 如何在不重新调整的情况下采用引擎版本

调参版本为 v003 的引擎版本,以及之前发布的引擎版本 2024 年 2 月 22 日,不支持超参数继承,但这些版本 可以用作超参数的来源。

如何调整引擎

如需触发调参,请参阅创建和管理引擎配置

具体而言,您需要选择以下选项:

  • 用于引擎调整的数据

    请指定数据集,并指定该数据集日期范围内的结束时间。

    引擎调整根据完整日历月来使用标签和功能 至(但不包括)选定结束时间的月份。有关 相关信息,请参阅数据集时间范围

  • 用于引擎调整的引擎版本

    选择与业务范围(零售或 商业内容),您将使用相关模型。

  • 根据模型您期望的调查量

    指定 partyInvestigationsPerPeriodHint。这供引擎调优使用, 训练和回测,以确保 AML AI 调查效果。

引擎调参输出

引擎调整会生成 EngineConfig 资源,该资源可用于 创建模型资源

引擎配置元数据包含以下指标。具体来说, 这些指标会显示以下内容:

  • 与使用默认引擎调优相比,通过引擎调优预计可以实现的效果提升 超参数

  • 可用于评估数据集一致性的测量结果(例如, 方法是将不同样本的特征系列的缺失值 操作)

指标名称 指标说明 指标值示例
ExpectedRecallPreTuning 使用 引擎版本的默认超参数

此召回率衡量假设每月调查次数 在 partyInvestigationsPerPeriodHint 中指定。

{
  "recallValues": [
    {
      "partyInvestigationsPerPeriod": 5000,
      "recallValue": 0.72,
      "scoreThreshold": 0.42,
    },
  ],
}
ExpectedRecallPostTuning 使用 经过调整的超参数

此召回率衡量假设每月调查次数 在 partyInvestigationsPerPeriodHint 中指定。

{
  "recallValues": [
    {
      "partyInvestigationsPerPeriod": 5000,
      "recallValue": 0.80,
      "scoreThreshold": 0.43,
    },
  ],
}
缺失

每个特征系列中所有特征的缺失值份额。

理想情况下,所有 AML AI 功能系列都应具有 缺失值接近于 0。如果底层数据的底层为数据, 这些功能系列无法集成。

在调优、 训练、评估和预测可能表明 使用的数据集。

{
  "featureFamilies": [
    {
      "featureFamily": "unusual_wire_credit_activity",
      "missingnessValue": 0.00,
    },
    ...
    ...
    {
      "featureFamily": "party_supplementary_data_id_3",
      "missingnessValue": 0.45,
    },
  ],
}

如何在不重新调整的情况下采用引擎版本

如需重复使用先前引擎配置中的超参数,请参阅本节 创建继承超参数的引擎配置(在 创建和管理引擎配置页面)。具体来说,您需要选择 以下:

  • 超参数来源类型:选择 INHERITED 作为 hyperparameterSourceType。如果您未指定来源类型, 超参数来源类型设置为 TUNING 以允许反向 兼容性。
  • 超参数来源:指定来源的完整资源名称 hyperparameterSource 对象中的引擎配置。这些代码的输出 源引擎配置会用于新的引擎配置。源引擎 同一配置中必须使用相同的引擎版本创建 调整引擎版本 所用的资源
  • 要用于引擎配置的引擎版本选择与业务范围(零售或 。如果继承超参数, 业务线必须与用于超参数的业务线匹配 来源。

继承时的输出和沿袭

从其他引擎版本继承超参数会创建一个 EngineConfig 资源,可用于创建模型资源(使用 来自来源引擎配置中的超参数。

对于沿袭,EngineConfig 资源中的以下字段设置为 从其他引擎配置继承超参数时,会发生以下情况:

  • hyperparameterSourceTypeINHERITED
  • hyperparameterSource:用作超参数来源的引擎配置
  • tuning:原始 tuning 对象,包括对 用于原始引擎调优 (primaryDataset) 的数据集, 数据用于生成训练特征的最新时间 (endTime)
  • performanceTarget:原始 performanceTarget 对象,包括 根据指定模型预计的调查量 (partyInvestigationsPerPeriodHint)
  • 来自原始引擎调整的引擎配置元数据