Présentation du processus

Présentation

Cette page présente les processus d'AML basée sur l'IA et aborde les concepts clés afin que les clients puissent les comprendre. Il s'adresse principalement aux équipes qui utiliseront l'IA AML pour entraîner, tester et déployer des modèles.

L'AML basée sur l'IA permet aux banques d'entraîner, de tester et de déployer automatiquement pour détecter le blanchiment d'argent. Les guides sur l'IA pour la lutte contre le blanchiment d'argent sont divisés en cinq sections de navigation de gauche à droite, qui correspondent aux cinq étapes suivantes.

ÉtapeDescription
1. Configurer l'AML basée sur l'IA Assurez-vous que votre projet Google Cloud est prêt à utiliser l'AML basée sur l'IA. Activer les services Google Cloud requis, et configurer la journalisation et les quotas Créez une ou plusieurs instances d'AML basée sur l'IA.
2. Préparer les données pour l'AML basée sur l'IA Examinez le modèle de données et le schéma. Priorisez les données à inclure. Collecter et transformer les données bancaires essentielles nécessaires, enquêter sur les risques les données et toutes les autres données dont vous avez besoin. Créer et valider un ensemble de données
3. Générer un modèle et évaluer ses performances Comprendre les moteurs, modèles et tests rétrospectifs d'IA de lutte contre le blanchiment d'argent
  1. Configurer un moteur
  2. Entraîner un modèle
  3. Évaluer les performances d'un modèle
4. Générer des scores de risque et une explicabilité Enregistrez les clients de vos banques commerciales et de détail. Utiliser un modèle pour génèrent des scores de risque par partie et une explicabilité pour:
  • Analyse et test pour la gouvernance des risques
  • Utilisation en préproduction et en production
5. Se préparer à la gouvernance des modèles et des risques Combiner les résultats générés par l'AML basée sur l'IA (réglage, entraînement, l'évaluation et la prédiction à l'aide de la documentation produit et conceptuelle d'AML pour aux exigences de votre modèle de processus de gouvernance des risques.

Les principales opérations techniques d'AML basée sur l'IA pour créer, tester et déployer sont les suivants. Ces étapes d'assistance 2 à 4 du tableau précédent.

  1. Créer un ensemble de données d'IA AML : crée un ensemble structuré de tables de données d'entrée BigQuery pour l'IA AML.
  2. Configuration du moteur : règle un moteur d'AML basée sur l'IA Ensemble de données d'AML basée sur l'IA, y compris les réglages d'hyperparamètres
  3. Entraînement du modèle : entraîne un modèle d'AML basée sur l'IA à l'aide d'un moteur Configuration et ensemble de données
  4. Backtest : teste un modèle d'IA AML sur des données historiques d'un ensemble de données et résume les performances
  5. Enregistrer les parties : enregistre les parties (clients de la banque ayant des produits bancaires, et d'envoyer ou de recevoir des transactions). prédiction
  6. Prédiction : génère des scores de parti et une explicabilité à utiliser en production

Configuration du moteur, entraînement du modèle, test rétrospectif du modèle et prédiction de modèle exiger un ensemble de données d'AML basée sur l'IA en entrée et renvoyer les artefacts correspondants ; utilisés dans d'autres opérations. (par exemple, l'entraînement du modèle). renvoie une référence à un modèle AML IA entraîné que vous pouvez utiliser pour les tests rétrospectifs ou la prédiction. Pour plus de détails techniques sur les opérations, consultez le Documentation de référence sur REST

Arborescence de dépendances pour les processus d'AML basée sur l'IA

Arbre des dépendances pour les processus d'IA de lutte contre le blanchiment d'argent

Points importants à prendre en compte lors de l'utilisation de l'AML basée sur l'IA

Cette section est conçue pour présenter aux clients les concepts clés de l'AML basée sur l'IA et vous conseiller sur les bonnes pratiques à adopter. Voici les sujets abordés ici : consultez les guides dédiés et les liens fournis pour en savoir plus en lecture seule.

Cohérence des dates

L'AML basée sur l'IA utilise différentes périodes pour différentes opérations. Les dates sélectionnées pour chaque opération doivent être vérifiées afin de s'assurer des résultats fiables. En particulier, pour éviter les biais dans les résultats, il est important que les mois utilisés pour entraîner un modèle d'IA AML ne se chevauchent pas avec ceux utilisés pour le rétrocompatibilité.

Étant donné qu'un ensemble de données d'AML basée sur l'IA contient de nombreux mois de données, les ensembles de données peut être utilisé pour plusieurs opérations, à condition que les dates indiquées soient correctes. Le schéma suivant illustre un cycle de développement utilisant l'AML basée sur l'IA, Différentes périodes d'un même ensemble de données couvrant 42 mois sont utilisées pour configurer un moteur (réglage des hyperparamètres), un entraînement et des tests rétrospectifs. Tout ces processus utilisent des périodes d'analyse qui fournissent du contexte au modèle et peuvent se chevaucher en toute sécurité avec les données utilisées pour d'autres opérations.

Pour en savoir plus sur les ensembles de données et les périodes d'AML basée sur l'IA, opérations, consultez la section Comprendre le champ d'application et la durée des données.

Pour vous assurer d'enregistrer correctement les modifications apportées à vos données au fil du temps, consultez Évolution des données au fil du temps.

Créer un ensemble de données d'AML basée sur l'IA – étapes 1-4

Fréquence des lots de production

En matière de prédiction, l'AML basée sur l'IA génère des scores de risque AML par mois calendaire. Les clients utilisent généralement l'AML basée sur l'IA dans le cadre d'un traitement mensuel par lot. qu'il est conseillé d'exécuter des prédictions sur des mois avec des données de transaction complètes possible.

Cohérence des champs

Comme pour tout processus de machine learning, les données d'entraînement et de test doivent être aussi cohérentes que possible. Si les champs ne sont pas renseignés de manière cohérente, les modifications peuvent entraîner des résultats peu fiables. Il est fortement recommandé de prendre des mesures pour s'assurer que les champs sont renseignés de manière cohérente pour chaque opération d'un cycle de développement, en particulier si des ensembles de données différents sont utilisés pour chaque opération. Pour en savoir plus, consultez la section Cohérence des ensembles de données.

Configurations du moteur

Une fois qu'une configuration de moteur a été créée, il n'est généralement pas nécessaire de recréer pour chaque nouvel ensemble de données ou à chaque cycle de développement. Les hyperparamètres choisis dans une configuration de moteur pour un ensemble de données sont généralement performants sur des ensembles de données similaires.

Les cycles de développement itératifs sont illustrés dans le schéma suivant, tandis que Le schéma précédent utilise un seul ensemble de données pour l'entraînement du modèle et le test rétrospectif. opérations.

Pour en savoir plus, découvrez quand régler ou hériter.

Créer un ensemble de données d'AML basée sur l'IA – étape 3-4

Traçabilité des données

La plupart des règles de gouvernance des modèles définissent une exigence de suivi de la traçabilité des données utilisée pour toutes les opérations de ML : configuration du moteur, entraînement, évaluation la prédiction. Il incombe aux clients de suivre la traçabilité de ces données.

Nous recommandons d'utiliser un identifiant unique dans les noms de toutes les données d'entrée, les ressources d'AML basée sur l'IA et les données de sortie pour suivre la traçabilité à travers les étapes. Cela permet de garantir des liens solides entre les ressources lors d'une exécution donnée. Les clients peuvent aussi ajouter une étiquette à toutes les ressources d'AML basée sur l'IA afin d'assurer la traçabilité exigences.

Nous vous recommandons également d'utiliser des instantanés BigQuery dans les requêtes API pour : pour garantir une traçabilité précise des données.

Cette configuration permet de répondre à des questions telles que "Où ce moteur de votre configuration ?" et "D'où vient ce modèle ?". tout en aidant pour enquêter et résoudre les incidents.

Pour savoir comment créer et gérer des ressources d'AML basée sur l'IA, consultez le l'API REST.

Créer un ensemble de données d'AML basée sur l'IA – étape 3-4