Il est essentiel d'évaluer l'impartialité du modèle pour éviter de perpétuer les biais et les discriminations. Cette page met l'accent sur l'importance de l'évaluation de l'équité dans les modèles d'évaluation des risques de blanchiment d'argent, fournit des insights sur l'application de l'égalité des chances (à titre d'exemple) et propose des pistes de mitigation potentielles.
Pertinence
Plusieurs raisons justifient l'évaluation de l'impartialité des modèles, y compris les suivantes:
- Création ou amplification de biais et de préjudices sociétaux négatifs: l'équité des modèles est essentielle pour éviter toute discrimination à l'encontre d'individus en raison de leurs attributs démographiques, tels que le genre, l'origine ethnique ou l'âge.
- Conformité réglementaire: les banques doivent respecter les normes légales et éthiques, y compris les lois et règlements antidiscrimination.
- Maintenir la confiance: l'équité dans les modèles d'évaluation des risques de blanchiment d'argent permet de maintenir la confiance des clients et de promouvoir une réputation positive pour la banque.
Calculer l'impartialité du modèle
Il existe plusieurs façons d'évaluer l'équité du machine learning (voir les bonnes pratiques générales). Nous vous recommandons de prendre en compte l'égalité des chances pour évaluer l'impartialité du modèle. Dans ce contexte, l'égalité des cotes mesure si le modèle traite de manière égale les parties appartenant à différents groupes démographiques en fonction de leurs scores de risque.
Pour calculer l'égalité des cotes, procédez comme suit:
- Définissez les groupes protégés pour lesquels vous souhaitez tester l'impartialité du modèle :
- Votre banque a généralement mis en place une gouvernance des modèles pour les catégories protégées. Il peut s'agir de catégories telles que le genre, l'origine ethnique, l'âge groupé et d'autres.
- Dans le tableau Partie, les champs que nous vous recommandons d'utiliser sont accompagnés de la remarque "Généralement également utilisé pour l'évaluation de l'équité".
Pour chaque catégorie protégée, calculez les métriques suivantes:
Taux de vrais positifs (TVP): proportion d'individus correctement classés comme à haut risque parmi ceux qui présentent un risque élevé réel en fonction des scores de risque attribués par le modèle.
Le taux de faux négatifs (FNR) est égal à (1 - TVP). Il s'agit d'une autre façon de mesurer la fréquence à laquelle un modèle ne parvient pas à atteindre la cible pour un groupe donné.
Taux de faux positifs (FPR): proportion d'individus classés à tort comme présentant un risque élevé parmi ceux qui présentent en réalité un faible risque en fonction des scores de risque attribués par le modèle.
Vous pouvez utiliser ce modèle de script SQL pour le calcul, en l'adaptant si nécessaire aux dimensions sensibles spécifiques pour lesquelles vous devez effectuer une analyse d'équité.
Comparez les valeurs de TVP et de TFP entre différents groupes démographiques.
Voici quelques points importants à prendre en compte pour calculer la TPR et la FPR:
- Spécifiez soigneusement l'ensemble complet d'exemples pour lesquels le TPR et le FPR seront calculés. Par exemple, comptez toutes les parties d'une même activité à une date spécifique d.
- Spécifiez soigneusement ce qui définit un exemple positif réel. Par exemple, une partie pour laquelle toute alerte provenant de n'importe quel système et toute enquête commençant après la date d a entraîné le déclenchement du processus de sortie du client pour des raisons liées à la lutte contre le blanchiment d'argent.
- Spécifiez soigneusement ce qui est considéré comme une prédiction positive. Par exemple, tous les clients pour lesquels les scores de risque AML AI pour la date d sont supérieurs à un seuil de score de risque choisi, que vous utiliserez pour déclencher des alertes.
Interpréter les résultats et les approches d'atténuation
Un taux de faux positifs plus élevé pour un segment ou un groupe démographique spécifique signifie que le modèle est plus susceptible de classer de manière incorrecte les individus de ce groupe comme présentant un risque élevé, ce qui entraîne des investigations inutiles. Cela indique que les individus de ce groupe démographique sont signalés de manière disproportionnée pour examen, ce qui peut entraîner un examen plus approfondi ou des désagréments pour les personnes qui ne présentent pas nécessairement un risque plus élevé.
Un taux de vrais positifs plus faible pour un segment ou un groupe démographique spécifique signifie que le modèle est moins efficace pour classer correctement les individus de ce groupe comme à haut risque, ce qui entraîne un taux de faux négatifs plus élevé. Cela indique que les individus de ce groupe démographique qui devraient être signalés pour examen sont plus susceptibles d'être ignorés ou négligés par le modèle par rapport aux autres groupes.
Les écarts entre les FPR et les TPR, ainsi que les seuils à partir desquels vous devez examiner ces écarts plus en détail, doivent être pris en compte dans votre processus de gouvernance des risques liés aux modèles. Si vous décidez que le risque mérite une enquête plus approfondie, voici les causes et les mesures d'atténuation possibles à prendre en compte.
Causes potentielles
La liste suivante décrit les causes potentielles des disparités entre les taux de faux positifs et de vrais positifs entre les groupes démographiques:
- Exemples positifs insuffisants: vous n'avez pas détecté suffisamment de ce type de client (pas assez d'enquêtes ou d'alertes positives). Il est possible que vous n'examiniez pas suffisamment les dossiers ou que ce type de client ne soit pas très risqué.
- De nombreux exemples positifs non justifiés: vous détectez un biais de SAR (rapport d'activité suspecte) défensif ou un biais de sortie client envers un groupe de clients particulier.
- Nombre total d'exemples insuffisant: vous ne disposez pas d'assez de clients de ce type dans votre clientèle.
D'autres aspects de la qualité des données et de la génération de modèles peuvent également avoir un impact sur l'équité.
Options d'atténuation
La liste suivante présente les options d'atténuation des causes profondes de la section précédente:
- Envisagez de rediriger la capacité des enquêteurs vers les groupes de clients avec un TPR plus élevé et / ou un FPR plus faible afin de rééquilibrer ces valeurs à l'avenir.
- Examiner le processus d'investigation et les investigations précédentes pour détecter les résultats biaisés pour les segments présentant une disparité significative entre le FPR et le TPR
- Randomiser les investigations pour obtenir plus d'exemples positifs
- Examinez vos données complémentaires de partie (voir la section Données complémentaires). Envisagez de supprimer les données qui présentent une forte corrélation avec les catégories sensibles et d'ajouter des données qui expriment le facteur de risque sous-jacent (sans biais). Prenons l'exemple d'un cas où les alertes du modèle sont concentrées dans certains codes postaux. Le facteur de risque sous-jacent peut être une concentration d'entreprises à forte intensité de trésorerie plutôt que la zone géographique elle-même.
Les éléments suivants sont déconseillés:
- Supprimez des parties ou des événements de cas de risque pour des groupes de clients spécifiques afin de rééquilibrer la FPR ou la TPR (en fait, un sous-échantillonnage). En raison de la nature en réseau des données et des fonctionnalités d'IA AML, cela peut avoir un impact imprévisible sur le comportement et les performances du modèle.
Si vous constatez toujours que la gouvernance des risques du modèle est bloquée sur l'équité, nous vous suggérons de continuer à utiliser la version actuelle de votre moteur ou de votre ensemble de données, et de contacter l'assistance pour obtenir des conseils supplémentaires.