Comprendre la portée et la durée des données

L'IA de lutte contre le blanchiment d'argent est conçue pour évaluer le risque de blanchiment d'argent pour un seul secteur d'activité. Une unité d’exploitation est associée à l’un de vos les clients commerciaux.

Lors de la création d'un jeu de données à utiliser avec un niveau de service, vous devez inclure plusieurs tableaux. Chaque table doit couvrir une période suffisamment longue. Cette page présente les tables dont vous aurez besoin et explique comment déterminer la période à couvrir pour chacune d'elles.

Tables à utiliser

L'ensemble de données BigQuery utilisé avec l'AML basée sur l'IA doit contenir les tables suivantes:

  • Partie : toutes les parties concernées par ce secteur d'activité
    • Secteur de la vente au détail: tous les clients d'une banque de détail qui détenaient des comptes au à n'importe quel moment de la période requise
    • LoB commercial: tous les clients d'une banque commerciale (juridique et naturel) entités) qui ont détenu des comptes au cours de la période requise
  • AccountPartyLink : historique complet des comptes détenus par les différentes parties. Cela devrait couvrir tous les comptes pour les produits et services lorsqu'une partie de la table "Partie" était le titulaire principal du compte à un moment donné de la période requise.
  • Transaction : toutes les transactions pour les comptes du tableau "AccountPartyLink" pour la période requise.
  • RiskCaseEvent : tous les événements de cas à risque (voir les valeurs de type d'événement) pour tout cas à risque et toute partie dans le tableau "Party" avec un élément AML_PROCESS_START (début de l'enquête) dans la période requise. Ce tableau peut inclure des événements dont l'heure est antérieure ou postérieure à la période requise.
  • PartySupplementaryData: (si utilisé) pour 0 à 100 uniques party_supplementary_data_id, incluent un historique complet des valeurs de ces champs pour toutes les parties dans la table des parties pendant la période requise.

Utiliser des données supplémentaires

Consultez la section Données supplémentaires si vous disposez de données supplémentaires sur les parties (non couvertes par le schéma) pertinentes pour identifier les risques de blanchiment d'argent.

Plage temporelle de l'ensemble de données

La période que tout tableau d'un jeu de données doit couvrir peut être calculée comme pour toute opération donnée. Vous devez savoir :

  • Heure de fin. Il s'agit du dernier moment à partir duquel les étiquettes sont utilisées et à partir de laquelle les données sont utilisées pour générer des caractéristiques pour le réglage.
  • La version du moteur que vous utiliserez (voir la liste des versions du moteur).
  • L'opération que vous allez effectuer: régler, entraîner, prédire ou contre-tester.
  • Pour les opérations de prédiction ou de rétrotest, il s'agit du nombre de périodes pendant lesquelles vous effectuerez l'opération, à spécifier dans l'appel d'API.

Comprendre la durée de la portée des données

Vous devez d'abord déterminer le nombre de périodes que l'opération utilisera. C'est Nombre de mois consécutifs se terminant le dernier mois calendaire complet précédant le à l'heure de fin spécifiée, pour laquelle l'AML basée sur l'IA évaluera les caractéristiques du modèle.

  • Pour les opérations de prédiction et de backtest, il s'agit du nombre de périodes de prédiction ou de backtest spécifiées dans l'appel d'API.
  • Pour les autres opérations, cela dépend de la version du moteur et de l'opération. Par exemple, les versions de moteur v004.004 utilisent 18 périodes pour le réglage et 15 pour l'entraînement.

Vous devez ensuite déterminer la période d'analyse pour chaque table. Il s'agit de la valeur nombre de mois de données nécessaires à cette table pour que l'AML basée sur l'IA puisse calculer le modèle pour une période donnée.

  • Par exemple, 13 mois pour les versions de moteur v004.004 et AccountPartyLink, 12 mois pour le tableau RiskCaseEvent et 0 mois pour les tables Party et PartySupplementaryData.

L'ensemble de données doit couvrir la période d'analyse pour toutes les périodes utilisées par l'opération choisie. Vous pouvez calculer le nombre de mois calendaires complets de données avant l'heure de fin dont vous aurez besoin pour une opération donnée à l'aide de la formule suivante :

  • nombre de périodes + période d'analyse -1

Par exemple, pour les versions de moteur v004.00X effectuant un réglage, vous avez besoin des éléments suivants :

  • 18 + 13 - 1 = 30 mois de données des tables "Transaction" et "AccountPartyLink",
  • 18 + 12 - 1 = 29 mois de données provenant du tableau des événements de cas de risque, ainsi que tous les événements plus récents pour les cas à risque dans le tableau,
  • Et 18 + 0 - 1 = 17 mois de données provenant de PartySupplementaryData et de PartySupplementaryData tableaux.