AML AI 旨在为企业评估洗钱风险 业务线。一个 LoB 与您的某个零售或商业客户相关联。
创建与 LoB 搭配使用的数据集时,应首先确定 数据集应涵盖的范围。
数据集时间范围
时间范围由三部分组成:
核心时间范围:此时间范围必须由 数据集。不同的 API 操作 针对生成特征和标签的核心时间范围的要求:
- 创建引擎配置(用于调优):至少 18 个月
- 创建模型(用于训练):至少 15 个月
- 创建预测结果(用于评分):至少 1 个月
- 创建回测结果(用于回测或模型评估):至少 3 个月,包括 延长月数,以便进行更精确的评估
回溯期:系统需要另外提供 24 个月的数据, 核心时间窗口,以支持跟踪活动随时间变化的模型特征。 最低回溯期要求因表格而异。
- 以下表需要 24 个月的完整回溯期:
- 以下表格需要至少 12 个月的回溯期:
- 下表不需要回溯期:
其他风险案例事件:可以添加比数据集结束时间更近的风险案例数据,以便获得更完整的标签来训练和评估模型。
例如,您必须创建引擎配置才能使用 AML AI 的其余部分。您必须创建数据集,其中包含至少 42 个月的交易数据(18 个月的主要时间范围和 24 个月的回溯期)。
要使用的表
对于给定的核心时间范围和 LoB,使用的 BigQuery 数据集 应包含以下表:
- 方:在整个期间内与该 LoB 相关的所有各方
核心时间范围 - 无回溯期要求
- 零售 LoB:所有在该国家/地区开立账户的零售银行客户 核心时间窗口的任何时间点
- 商业 LoB:所有商业银行客户(法律和自然业务类型) 在核心时间范围内的任何时间点持有账号的实体)
- AccountPartyLink:有关特定账号的完整历史记录 (即 24 个月内) 回溯期此要求应涵盖产品和服务的所有账号 政党表格中的某个政党是(或曾经)主要 账号持有人
- 交易: AccountPartyLink 表,如下所示: 以及 24 个月的回溯期
- RiskCaseEvent:所有风险情形事件(请参阅事件
type
) 值)作为方表中任何风险案例和一方,且 核心时间范围内的AML_PROCESS_START
(调查开始),以及 最短 12 个月的回溯期。这些活动中有些可能有一个活动 早于或晚于核心时间范围和回溯期的时间。 - PartySupplementaryData:(如果使用)代表 0 到 100 个唯一值
party_supplementary_data_id
值,包括值的完整历史记录 Party 表(针对 核心时间窗口 - 无回溯期。
使用额外数据
如果您有关于各方的其他数据,请参阅补充数据 (未以其他方式包含在架构中)与识别资金相关 洗钱风险