AML AI 用于评估一个业务线的洗钱风险。LoB 与您的某个零售或商业客户相关联。
创建用于 LoB 的数据集时,应首先确定数据集应涵盖的时间范围。
数据集时间范围
时间范围由三个部分组成:
核心时间范围:数据集中的所有表都必须涵盖此时间范围。不同的 API 操作对生成特征和标签的核心时间窗口有不同的要求:
- 创建引擎配置(用于调整):至少 18 个月
- 创建模型(用于训练):至少 15 个月
- 创建预测结果(用于评分):至少 1 个月
- 创建回测结果(用于回测或模型评估):至少 3 个月,还可以有更多月份可以进行更精确的评估
回溯期:在核心时间窗口之前需要额外的 24 个月数据,以支持跟踪随时间变化的活动的模型特征。最短回溯期要求因表而异。
- 以下表格需要 24 个月的完整回溯期:
- 下表至少需要 12 个月的回溯期:
- 以下表不需要回溯期:
其他风险案例事件:可包含早于数据集结束时间的风险案例相关数据,以获得更完整的标签,以用于训练和评估模型。
例如,您必须创建引擎配置才能使用其余 AML AI。您必须创建数据集,使其涵盖至少 42 个月的交易数据(18 个月的核心时间窗口和 24 个月的回溯期)。
要使用的表
对于给定的核心时间窗口和 LoB,与 AML AI 搭配使用的 BigQuery 数据集应包含以下表:
- Party:与该 LoB 相关且在整个核心时间范围内的所有相关方 - 无需回溯期
- 零售业 LoB:在核心时间范围内任何时间持有账户的所有零售银行客户
- 商业银行客户:在核心时间范围内任何时间点持有过帐号的所有商业银行客户(法律和自然实体)
- AccountPartyLink:完整核心时段和 24 个月的回溯期内哪些各方持有哪些帐号的完整历史记录。当方表中的一方是(或曾经)是主要账号持有人时,此账号应涵盖产品和服务的所有账号
- 交易:AccountPartyLink 表中整个核心时段和 24 个月回溯期内帐号的所有交易
- RiskCaseEvent:“Party”表中任何风险案例和相关方的所有风险案例事件(请参阅事件
type
值),核心时间范围为AML_PROCESS_START
(调查开始),回溯期最短为 12 个月。其中一些事件的事件时间可能早于或晚于核心时间范围和回溯期。 - PartySupplementaryData:(如果使用)对于 0 到 100 个唯一
party_supplementary_data_id
值,请在核心时间范围的 Party 表中添加所有相关方的这些字段值的完整历史记录,不需要回溯期。
使用其他数据
如果您有与识别洗钱风险相关的其他方数据(未在架构中另行涵盖),请参阅补充数据。