了解数据范围和时长

AML AI 旨在为企业评估洗钱风险 业务线。一个 LoB 与您的某个零售或商业客户相关联。

创建与 LoB 搭配使用的数据集时,应首先确定 数据集应涵盖的范围。

数据集时间范围

时间范围由三部分组成:

历史数据要求图表

  • 核心时间范围:此时间范围必须由 数据集。不同的 API 操作 针对生成特征和标签的核心时间范围的要求:

    • 创建引擎配置(用于调优):至少 18 个月
    • 创建模型(用于训练):至少 15 个月
    • 创建预测结果(用于评分):至少 1 个月
    • 创建回测结果(用于回测或模型评估):至少 3 个月,包括 延长月数,以便进行更精确的评估

  • 回溯期:系统需要另外提供 24 个月的数据, 核心时间窗口,以支持跟踪活动随时间变化的模型特征。 最低回溯期要求因表格而异。

  • 其他风险案例事件:可以添加比数据集结束时间更近的风险案例数据,以便获得更完整的标签来训练和评估模型。

例如,您必须创建引擎配置才能使用 AML AI 的其余部分。您必须创建数据集,其中包含至少 42 个月的交易数据(18 个月的主要时间范围和 24 个月的回溯期)。

要使用的表

对于给定的核心时间范围和 LoB,使用的 BigQuery 数据集 应包含以下表:

  • :在整个期间内与该 LoB 相关的所有各方 核心时间范围 - 无回溯期要求
    • 零售 LoB:所有在该国家/地区开立账户的零售银行客户 核心时间窗口的任何时间点
    • 商业 LoB:所有商业银行客户(法律和自然业务类型) 在核心时间范围内的任何时间点持有账号的实体)
  • AccountPartyLink:有关特定账号的完整历史记录 (即 24 个月内) 回溯期此要求应涵盖产品和服务的所有账号 政党表格中的某个政党是(或曾经)主要 账号持有人
  • 交易AccountPartyLink 表,如下所示: 以及 24 个月的回溯期
  • RiskCaseEvent:所有风险情形事件(请参阅事件 type) 值)作为方表中任何风险案例和一方,且 核心时间范围内的 AML_PROCESS_START(调查开始),以及 最短 12 个月的回溯期。这些活动中有些可能有一个活动 早于或晚于核心时间范围和回溯期的时间。
  • PartySupplementaryData:(如果使用)代表 0 到 100 个唯一值 party_supplementary_data_id 值,包括值的完整历史记录 Party 表(针对 核心时间窗口 - 无回溯期。

使用额外数据

如果您有关于各方的其他数据,请参阅补充数据 (未以其他方式包含在架构中)与识别资金相关 洗钱风险