了解数据范围和时长

AML AI 旨在为企业评估洗钱风险 业务线。某个 LoB 与您的某个零售店或 。

创建要与 LoB 搭配使用的“数据集”时,您需要添加多个表。每个表都应涵盖足够的时间范围。本页提供了 并展示如何确定时间范围 应覆盖的层。

要使用的表

与 AML AI 搭配使用的 BigQuery 数据集应包含以下表:

  • 相关方:与该 LoB 相关的所有相关方
    • 零售 LoB:所有在 以下国家/地区开立账户的零售银行客户 所需时间范围内的任何时间点
    • 商业 LoB:在所需时间范围的任意时间点拥有账户的所有商业银行客户(法人和自然人)
  • AccountPartyLink:有关特定账号的完整历史记录 具体由哪些各方持有。这应涵盖在所需时间范围内的任意时间点,相关产品和服务的所有账号的所有者均为“相关方”表中的任何一方。
  • 交易:AccountPartyLink 表中账号在所需时间范围内的所有交易。
  • RiskCaseEvent:所有风险情形事件(请参阅事件类型) 值)。 AML_PROCESS_START(调查开始)。这个 表格可能包含事件时间早于或晚于 所需的时间范围。
  • PartySupplementaryData:(如果使用)对于 0 到 100 个唯一的 party_supplementary_data_id 值,请在 Party 表中包含所需时间范围内所有政党的这些字段值的完整历史记录。

使用额外数据

如果您有与识别洗钱风险相关的有关相关方的其他数据(架构中未涵盖),请参阅补充数据

数据集时间范围

对于任何给定操作,数据集中任何表应涵盖的时间范围可按如下方式计算得出。您必须知道以下信息:

  • 结束时间。这是使用标签的时间以及数据用于生成调优特征的最晚时间。
  • 您将使用的引擎版本(请参阅引擎版本列表)。
  • 您将执行的操作:调优、训练、预测或回测。
  • 对于预测或回测操作,将执行操作的时间段数,将在 API 调用中指定。

了解数据范围的持续时间

首先,您应该计算该操作将使用的周期数。这是指在指定结束时间之前的最后一个完整日历月结束的连续月份数,AML AI 将针对这些月份评估模型特征。

  • 对于预测和回测操作,这是 API 调用中指定的预测期或回测期的数量。
  • 对于其他操作,这取决于引擎版本和操作。 例如,v004.004 引擎版本使用 18 个周期进行调优,15 个周期进行训练。

接下来,您应确定每个表的回溯期。这是 AML AI 计算给定时间段的模型特征所需从该表中获取的数据的月份数上限。

  • 例如,对于 v004.004 引擎版本,交易期限为 13 个月 和 AccountPartyLink 表,RiskCaseEvent 表为 12 个月,值为 0 对于 Party 和 PartySupplementaryData 表,使用 false。

数据集需要涵盖所有所用时间段的回溯期 所选操作的结果。您可以使用以下公式计算在结束时间之前,给定操作所需的完整自然月数据的数量:

  • 周期数 + 回溯期 -1

例如,对于执行调整的 v004.00X 引擎版本,您需要:

  • 18 + 13 - 1 = 30 个月来自 Transaction 和 AccountPartyLink 的数据 表格
  • 18 + 12 - 1 = 29 个月的数据(来自“风险案例事件”表格),以及表格中风险案例的任何较新事件
  • 从 Party 和 PartySupplementaryData 表中获取 18 + 0 - 1 = 17 个月的数据。