AML AI 旨在评估一个业务线的洗钱风险。LoB 与您的某个零售或商业客户相关联。
创建用于 LoB 的数据集时,应首先确定数据集应涵盖的时间范围。
数据集时间范围
时间范围由三个部分组成:
核心时间范围:此时间范围必须被数据集中的所有表覆盖。不同的 API 操作对生成特征和标签的核心时间窗口有不同的要求:
- 创建引擎配置(用于调整):至少 18 个月
- 创建模型(用于训练):至少 15 个月
- 创建预测结果(评分):至少 1 个月
- 创建回测结果(用于回测或模型评估):至少需要 3 个月,可以留出更多月份来进行更精确的评估
回溯期:在核心时间窗口之前还需要 24 个月的数据,以支持跟踪活动随时间变化的模型特征。最短回溯期要求因表格而异。
- 以下表需要 24 个月的完整回溯期:
- 下表至少需要 12 个月的回溯期:
- 以下表不需要回溯期:
其他风险案例事件:可以包含比数据集结束时间更近的风险案例的数据,以获得更完整的标签,以用于训练和评估模型。
例如,您必须创建引擎配置才能使用 AML AI 的其余部分。您必须创建一个数据集,其中至少涵盖 42 个月的交易数据(18 个月的核心时间范围和 24 个月的回溯期)。
要使用的表
对于给定的核心时间窗口和 LoB,用于 AML AI 的 BigQuery 数据集应包含以下表:
- Party:与该 LoB 相关的所有各方,在整个核心时间范围内,无需回溯期
- 零售 LoB:在核心时间范围内任何时间点持有账户的所有零售银行客户
- 商业 LoB:在核心时间范围内任何时间点持有账户的所有商业银行客户(法律和自然实体)
- AccountPartyLink:哪些帐号由哪一方持有的完整历史记录在整个核心时间范围内以及 24 个月的回溯期内。当 Party 表中的一方是(或曾)是主要帐号持有人时,这应涵盖产品和服务的所有帐号
- 交易:AccountPartyLink 表中帐号在整个核心时间范围内以及 24 个月的回溯期内的所有交易
- RiskCaseEvent:Party 表中任何风险案例和方、核心时间范围为
AML_PROCESS_START
(调查开始)且回溯期至少为 12 个月的所有风险案例事件(请参阅事件type
值)。其中一些事件的事件时间可能早于或晚于核心时间范围和回溯期。 - PartySupplementaryData:(如果使用)对于 0 到 100 个唯一
party_supplementary_data_id
值,请在核心时间范围的 Party 表中添加所有相关方的这些字段值的完整历史记录,不需要回溯期。
使用(AML AI 架构中未涵盖的其他数据)
如果您有与识别洗钱风险相关的其他方数据(未涵盖在架构中),但架构中未涵盖这些数据,请参阅补充数据。