設定引擎

本頁面簡要說明設定引擎背後的概念。

本頁面適用於下列主要引擎版本群組中的引擎版本。如要查看其他引擎版本的頁面,請使用本頁頂端的選取器。

總而言之,以下是引擎版本 v003 到 v004 (最高至 v004.008) 的變更:

  • ExpectedRecallPreTuningExpectedRecallPostTuning 指標值中新增 partiesCountidentifiedPartiesCount

超參數支援的來源

設定引擎時,您可以選取用於建立模型的超參數來源。系統支援下列來源:

  • 自動調整:建立 EngineConfig 資源時,AML AI 會調整超參數 (預設行為)
  • 沿用:從先前使用相同微調版本的舊版引擎建立的引擎設定,沿用超參數。這樣一來,您就不必在每次採用新版模型引擎時重新調整。

何時應調整或沿用設定

以下各節將說明何時應選取自動調整,以及何時應沿用先前引擎設定的超參數。

調整時機

您可以調整每個新引擎的設定,如有疑問,請務必調整設定,以獲得最佳成效。詳情請參閱「如何調整引擎」一節。

為獲得最佳效能,發生下列任一情況時,您應考慮調整引擎:

  • 您對資料集邏輯進行重大變更。舉例來說,當下列任一項目變更時:
    • 填入欄位的邏輯
    • 填入的「建議」欄位
    • PartySupplementaryData 表格中提供的資料邏輯或選取項目
  • 您即將讓引擎訓練新區域的模型。

何時要沿用超參數

如要節省採用新引擎版本時的時間和成本,您可以沿用先前引擎的超參數,但必須使用相同的微調版本。請參閱「如何採用引擎版本,而不需重新調整」一節。

如果引擎版本使用調整版本 v003,或是 2024 年 2 月 22 日前發布的引擎版本,則不支援超參數繼承功能,但這些版本可用做超參數來源。

如何調整引擎

如要觸發微調作業,請參閱「建立及管理引擎設定」。

具體來說,您需要選取下列項目:

  • 用於引擎調整的資料:

    指定資料集和結束時間 (必須在資料集的日期範圍內)。

    引擎調整作業會使用完整日曆月 (最多到所選結束時間的月份,但不包括該月份) 的標籤和特徵。詳情請參閱「資料集時間範圍」。

  • 用於引擎微調的引擎版本:

    選取引擎版本,與您要使用相關聯模型的業務線 (零售或商業) 相符。

  • 根據模型預期的調查量:

    指定 partyInvestigationsPerPeriodHint。引擎調整、訓練和回溯測試都會使用這項資料,確保 AML AI 能在每月調查量下提供效能。

引擎調整輸出

引擎微調會產生 EngineConfig 資源,可用於建立 Model 資源

引擎設定中繼資料包含下列指標。具體來說,這些指標會顯示下列資訊:

  • 相較於使用預設超參數,引擎調整預期可帶來的效能提升

  • 可用於評估資料集一致性的指標 (例如,比較不同作業中特徵系列的遺漏值)

指標名稱 指標說明 指標值範例
ExpectedRecallPreTuning 使用引擎版本的預設超參數時,在測試集上測得的召回率指標。

這項召回測量值假設每月調查次數為 partyInvestigationsPerPeriodHint 中指定的次數。

{
  "recallValues": [
    {
      "partyInvestigationsPerPeriod": 5000,
      "recallValue": 0.72,
      "partiesCount": 100,
      "identifiedPartiesCount": 72,
      "scoreThreshold": 0.42,
    },
  ],
}
ExpectedRecallPostTuning 使用調整後的超參數時,在測試集上測量的召回率指標。

這項召回測量值假設每月調查次數為 partyInvestigationsPerPeriodHint 中指定的次數。

{
  "recallValues": [
    {
      "partyInvestigationsPerPeriod": 5000,
      "recallValue": 0.80,
      "partiesCount": 100,
      "identifiedPartiesCount": 80,
      "scoreThreshold": 0.43,
    },
  ],
}
遺漏值

每個特徵系列中所有特徵的遺漏值比例。

在理想情況下,所有 AML AI 功能系列都應接近 0。如果這些功能系列的基礎資料無法整合,就可能會發生例外狀況。

如果任何特徵系列的此值在微調、訓練、評估和預測之間出現顯著變化,可能表示所用資料集不一致。

{
  "featureFamilies": [
    {
      "featureFamily": "unusual_wire_credit_activity",
      "missingnessValue": 0.00,
    },
    ...
    ...
    {
      "featureFamily": "party_supplementary_data_id_3",
      "missingnessValue": 0.45,
    },
  ],
}

如何在不重新調整的情況下採用引擎版本

如要重複使用先前引擎設定中的超參數,請參閱「建立會沿用超參數的引擎設定」一節 (位於「建立及管理引擎設定」頁面)。特別是需要選取下列項目:

  • 超參數來源類型:選取 INHERITED 做為 hyperparameterSourceType。如未指定來源類型,超參數來源類型會設為 TUNING,以確保向後相容性。
  • 超參數來源:hyperparameterSource 物件中指定來源引擎設定的完整資源名稱。新引擎設定會使用來源引擎設定的輸出內容。來源引擎設定必須使用與目前微調引擎版本相同的較早引擎版本建立。
  • 引擎設定要使用的引擎版本: 選取與業務線 (零售或商業) 相符的引擎版本,以供要使用的模型使用。如要沿用超參數,業務線必須與超參數來源所用的業務線相符。

繼承時的輸出內容和沿襲

從其他引擎版本繼承超參數會建立 EngineConfig 資源,可用於使用來源引擎設定的超參數建立 Model 資源

如要沿用其他引擎設定的超參數,EngineConfig 資源中的下列欄位會設定如下:

  • hyperparameterSourceTypeINHERITED
  • hyperparameterSource:做為超參數來源的引擎設定
  • tuning:原始 tuning 物件,包括用於原始引擎調整的資料集參照 (primaryDataset),以及用於產生訓練特徵的最新資料時間 (endTime)
  • performanceTarget:原始 performanceTarget 物件,包括根據指定模型預期的調查量 (partyInvestigationsPerPeriodHint)
  • 原始引擎微調的引擎設定中繼資料