Comprendre la portée et la durée des données

L'AML basée sur l'IA est conçue pour évaluer les risques liés au blanchiment d'argent dans un secteur d'activité. Il est associé à l'un de vos clients, qu'il s'agisse d'un magasin ou d'un client commercial.

Lorsque vous créez un ensemble de données à utiliser avec une base de données, vous devez d'abord déterminer la période qu'il doit couvrir.

Période de l'ensemble de données

La période se compose de trois parties:

Graphique des exigences concernant les données historiques

  • Période principale: cette période doit être couverte par toutes les tables de l'ensemble de données. Différentes opérations d'API ont des exigences différentes concernant la période principale de génération de caractéristiques et de libellés:

    • Créer une configuration de moteur (pour le réglage): au moins 18 mois
    • Création d'un modèle (pour l'entraînement): au moins 15 mois
    • Création de résultats de prédiction (pour l'attribution de scores): au moins 1 mois
    • Création des résultats des rétrotests (pour le backtesting ou l'évaluation du modèle): au moins trois mois, ajoutez des mois supplémentaires pour une évaluation plus précise

  • Période d'analyse: 24 mois supplémentaires de données sont nécessaires avant la période principale pour prendre en charge les fonctionnalités du modèle qui suivent l'activité au fil du temps. Les exigences minimales de la période d'analyse varient selon les tableaux.

  • Événements de cas de risque supplémentaires: les données sur les cas de risque plus récents que l'heure de fin de l'ensemble de données peuvent être incluses afin d'obtenir des étiquettes plus complètes pour l'entraînement et l'évaluation des modèles.

Par exemple, vous devez créer une configuration de moteur pour utiliser le reste de l'AML basée sur l'IA. Vous devez créer un ensemble de données qui couvre au moins 42 mois de données de transaction (18 mois de période centrale et 24 mois de période d'analyse).

Tables à utiliser

Pour une fenêtre temporelle et une plage de travail données, l'ensemble de données BigQuery utilisé avec l'AML basée sur l'IA doit contenir les tables suivantes:

  • Partie: toutes les parties concernées par ce segment de clientèle sur l'ensemble de la période principale (aucune période d'analyse n'est requise).
    • Commerce de détail: tous les clients de la banque de détail ayant eu des comptes à tout moment pendant la période principale
    • Locaux commerciaux: tous les clients des banques commerciales (entités juridiques et naturelles) qui ont tenu un compte à un moment donné pendant la période principale
  • AccountPartyLink: historique complet des comptes détenus par les parties pour l'ensemble de la période principale et période d'analyse de 24 mois. Cela devrait couvrir tous les comptes de produits et services lorsqu'une partie du tableau Partie est (ou était) le titulaire principal du compte
  • Transaction: toutes les transactions des comptes du tableau AccountPartyLink pour l'ensemble de la période principale et la période d'analyse de 24 mois.
  • RiskCaseEvent: tous les événements de cas de risque (voir les valeurs type) pour tout cas de risque et toute partie dans la table Partie avec un AML_PROCESS_START (début de l'enquête) dans la période principale et une période d'analyse minimale de 12 mois. L'heure de certains de ces événements peut être antérieure ou postérieure à la période principale et à la période d'analyse.
  • PartySupplementaryData: (si utilisé) Pour 0 à 100 valeurs party_supplementary_data_id uniques, incluez l'historique complet des valeurs de ces champs pour toutes les parties dans la table Party pour la période principale. Aucune période d'analyse n'est requise.

Utiliser des données supplémentaires

Consultez la section Données supplémentaires si vous disposez de données supplémentaires sur les parties (non couvertes par le schéma) qui sont pertinentes pour identifier le risque de blanchiment d'argent.