了解数据范围和时长

AML AI 用于评估一个业务线的洗钱风险。LoB 与您的某个零售或商业客户相关联。

创建用于 LoB 的数据集时,应首先确定数据集应涵盖的时间范围。

数据集时间范围

时间范围由三个部分组成:

历史数据要求图表

  • 核心时间范围:数据集中的所有表都必须涵盖此时间范围。不同的 API 操作对生成特征和标签的核心时间窗口有不同的要求:

    • 创建引擎配置(用于调整):至少 18 个月
    • 创建模型(用于训练):至少 15 个月
    • 创建预测结果(用于评分):至少 1 个月
    • 创建回测结果(用于回测或模型评估):至少 3 个月,还可以有更多月份可以进行更精确的评估

  • 回溯期:在核心时间窗口之前需要额外的 24 个月数据,以支持跟踪随时间变化的活动的模型特征。最短回溯期要求因表而异。

  • 其他风险案例事件:可包含早于数据集结束时间的风险案例相关数据,以获得更完整的标签,以用于训练和评估模型。

例如,您必须创建引擎配置才能使用其余 AML AI。您必须创建数据集,使其涵盖至少 42 个月的交易数据(18 个月的核心时间窗口和 24 个月的回溯期)。

要使用的表

对于给定的核心时间窗口和 LoB,与 AML AI 搭配使用的 BigQuery 数据集应包含以下表:

  • Party:与该 LoB 相关且在整个核心时间范围内的所有相关方 - 无需回溯期
    • 零售业 LoB:在核心时间范围内任何时间持有账户的所有零售银行客户
    • 商业银行客户:在核心时间范围内任何时间点持有过帐号的所有商业银行客户(法律和自然实体)
  • AccountPartyLink:完整核心时段和 24 个月的回溯期内哪些各方持有哪些帐号的完整历史记录。当表中的一方是(或曾经)是主要账号持有人时,此账号应涵盖产品和服务的所有账号
  • 交易AccountPartyLink 表中整个核心时段和 24 个月回溯期内帐号的所有交易
  • RiskCaseEvent“Party”表中任何风险案例和相关方的所有风险案例事件(请参阅事件 type 值),核心时间范围为 AML_PROCESS_START(调查开始),回溯期最短为 12 个月。其中一些事件的事件时间可能早于或晚于核心时间范围和回溯期。
  • PartySupplementaryData:(如果使用)对于 0 到 100 个唯一 party_supplementary_data_id 值,请在核心时间范围的 Party 表中添加所有相关方的这些字段值的完整历史记录,不需要回溯期。

使用其他数据

如果您有与识别洗钱风险相关的其他方数据(未在架构中另行涵盖),请参阅补充数据