Présentation
Cette page présente les processus d'IA de lutte contre le blanchiment d'argent et décrit les concepts clés que les clients doivent comprendre. Il s'adresse principalement aux équipes qui utiliseront l'IA AML pour entraîner, tester et déployer des modèles.
L'IA AML permet aux banques d'entraîner, de tester et de déployer automatiquement des modèles de détection du blanchiment d'argent. Les guides sur l'IA pour la lutte contre le blanchiment d'argent sont divisés en cinq sections de navigation de gauche à droite, qui correspondent aux cinq étapes suivantes.
Étape | Description |
---|---|
1. Configurer l'AML basée sur l'IA | Assurez-vous que votre projet Google Cloud est prêt à utiliser l'IA AML. Activez les services Google Cloud requis, puis configurez la journalisation et les quotas. Créez une ou plusieurs instances d'IA AML. |
2. Préparer les données pour l'AML basée sur l'IA | Examinez le modèle de données et le schéma. Priorisez les données à inclure. Collectez et transformez les données bancaires de base, les données d'investigation des risques et toutes les autres données dont vous avez besoin. Créez et validez un ensemble de données. |
3. Générer un modèle et évaluer ses performances | Découvrez les moteurs, modèles et tests rétrospectifs d'IA de lutte contre le blanchiment d'argent.
|
4. Générer des scores de risque et une explicabilité | Enregistrez vos clients de services bancaires aux particuliers et commerciaux. Utilisez un modèle pour générer des scores de risque par parti et une explicabilité pour :
|
5. Se préparer à la gouvernance des modèles et des risques | Combinez les résultats de l'IA AML issus du réglage, de l'entraînement, de l'évaluation et de la prédiction avec la documentation sur le concept et le produit AML pour répondre aux exigences de votre processus de gouvernance des risques liés aux modèles. |
Les principales opérations techniques d'IA de lutte contre le blanchiment d'argent pour créer, tester et déployer des modèles sont les suivantes. Ces étapes correspondent aux étapes 2 à 4 du tableau précédent.
- Créer un ensemble de données AML AI : crée un ensemble structuré de tables de données d'entrée BigQuery pour l'AML basée sur l'IA
- Configuration du moteur : ajuste un moteur d'IA AML à un ensemble de données d'IA AML, y compris le réglage des hyperparamètres.
- Entraînement du modèle : entraîne un modèle d'IA AML à l'aide d'une configuration d'un moteur et d'un ensemble de données
- Backtest : teste un modèle d'IA AML sur des données historiques d'un ensemble de données et résume les performances
- Register Parties (Enregistrer les parties) : enregistre les parties (clients de la banque qui disposent de produits bancaires et envoient ou reçoivent des transactions) afin qu'elles puissent être évaluées dans la prédiction
- Prédiction : génère des scores de parti et une explicabilité à utiliser en production
La configuration du moteur, l'entraînement du modèle, le test du modèle et la prédiction du modèle nécessitent tous un ensemble de données d'IA AML en entrée et renvoient les artefacts correspondants, qui sont utilisés dans d'autres opérations. Par exemple, Model Training renvoie une référence à un modèle d'IA AML entraîné, qui peut être utilisé pour le backtesting ou la prédiction. Pour en savoir plus sur les opérations techniques, consultez la présentation de la documentation de référence REST.
Arbre des dépendances pour les processus d'IA de lutte contre le blanchiment d'argent
Éléments importants à prendre en compte lors de l'utilisation de l'IA AML
Cette section est conçue pour présenter aux clients les concepts clés de l'IA de lutte contre le blanchiment d'argent et leur donner des conseils sur certaines bonnes pratiques. Les sujets abordés ici sont traités plus en détail dans des guides dédiés, et des liens sont fournis pour en savoir plus.
Cohérence des dates
L'IA de lutte contre le blanchiment d'argent utilise différentes périodes pour différentes opérations. Vous devez faire attention aux dates sélectionnées pour chaque opération afin d'obtenir des résultats fiables. En particulier, pour éviter les biais dans les résultats, il est important que les mois utilisés pour entraîner un modèle d'IA AML ne se chevauchent pas avec ceux utilisés pour le rétrocompatibilité.
Étant donné qu'un ensemble de données d'IA AML contient de nombreux mois de données, les ensembles de données peuvent être utilisés pour plusieurs opérations, sous réserve de ces sélections de dates correctes. Le diagramme suivant illustre un cycle de développement utilisant l'IA AML, où différentes périodes d'un même ensemble de données couvrant 42 mois sont utilisées pour configurer un moteur (réglage des hyperparamètres), l'entraînement et le rétrocompatibilité. Tous ces processus utilisent des périodes d'analyse qui fournissent un contexte au modèle et peuvent se chevaucher sans risque avec les données utilisées pour d'autres opérations.
Pour en savoir plus sur les ensembles de données d'IA AML et les périodes pour différentes opérations, consultez Comprendre la portée et la durée des données.
Pour vous assurer d'enregistrer correctement les modifications apportées à vos données au fil du temps, consultez Modifications des données au fil du temps.
Fréquence des lots de production
Lors de la prédiction, l'IA AML génère des scores de risque AML sur la base d'un mois calendaire. Les clients utilisent généralement l'IA AML dans le cadre d'un traitement par lot mensuel. Nous leur conseillons d'exécuter des prédictions sur les mois avec des données de transaction complètes dans la mesure du possible.
Cohérence des champs
Comme pour tout processus de machine learning, les données d'entraînement et de test doivent être aussi cohérentes que possible. Si les champs ne sont pas renseignés de manière cohérente, les modifications peuvent entraîner des résultats peu fiables. Il est fortement recommandé de prendre des mesures pour s'assurer que les champs sont renseignés de manière cohérente pour chaque opération d'un cycle de développement, en particulier si des ensembles de données différents sont utilisés pour chaque opération. Pour en savoir plus, consultez la section Cohérence des ensembles de données.
Configurations du moteur
Une fois une configuration de moteur créée, il n'est normalement pas nécessaire de la recréer pour chaque nouvel ensemble de données ni à chaque cycle de développement. Les hyperparamètres choisis dans une configuration de moteur pour un ensemble de données sont généralement performants sur des ensembles de données similaires.
Les cycles de développement itératif sont illustrés dans le diagramme suivant, tandis que le diagramme précédent utilise un seul ensemble de données pour les opérations d'entraînement du modèle et de backtesting.
Pour en savoir plus, consultez la section Quand optimiser ou hériter.
Traçabilité des données
La plupart des règles de gouvernance des modèles définissent une exigence de suivi de la lignée des données utilisées dans toutes les opérations de ML, de la configuration du moteur, de l'entraînement, de l'évaluation et de la prédiction. Les clients sont tenus de suivre cette lignée de données.
Nous vous recommandons d'utiliser un identifiant unique dans les noms de toutes les données d'entrée, des ressources d'IA AML et des données de sortie pour suivre la lignée à chaque étape. Cela permet de garantir un lien solide entre les ressources d'une exécution donnée. Les clients peuvent également ajouter un libellé à toutes les ressources d'IA AML pour répondre aux exigences de traçabilité.
De plus, nous vous recommandons d'utiliser des instantanés BigQuery dans les requêtes d'API pour garantir une traçabilité précise des données.
Cette configuration permet de répondre à des questions telles que "d'où vient cette configuration de moteur ?" et "d'où vient ce modèle ?", tout en aidant à examiner et à résoudre les incidents.
Pour savoir comment créer et gérer des ressources d'IA de lutte contre le blanchiment d'argent, consultez les pages de l'API REST.