Glossaire de l'AML basée sur l'IA

Ce glossaire définit les termes spécifiques à l'AML basée sur l'IA. Pour connaître les termes généraux liés au machine learning, consultez le glossaire du machine learning.

B

backtesting

Le backtesting utilise des données historiques pour évaluer les performances (rappel observé) d'un modèle en comparant les scores de risque qu'il génère aux résultats réels d'investigations historiques.

résultats des backtests

Une ressource BacktestResult de l'AML basée sur l'IA (également appelée "résultats des tests rétro") est créée pour tester les performances d'un model sur un ensemble de données. Pour en savoir plus, consultez la page Évaluer un modèle.

C

données des services bancaires de base

Les données bancaires principales incluent les données sur les parties, les transactions et les titulaires de comptes. Elle aide l'AML AI à comprendre vos clients et leurs activités bancaires afin de détecter les caractéristiques et comportements à risque.

fenêtre de temps processeur

La période de temps critique désigne la période utilisée dans une opération d'AML basée sur l'IA (configuration du moteur, entraînement, rétrotests et prédiction) pour générer des exemples d'entraînement, d'évaluation ou de sortie de modèle. Cette période doit être couverte par toutes les tables de l'ensemble de données.

Les exigences liées à la fenêtre de temps principale varient en fonction des opérations d'API pour générer des caractéristiques et des étiquettes. Pour en savoir plus, consultez Comprendre la portée et la durée des données.

D

ensemble de données

Une ressource d'ensemble de données d'AML basée sur l'IA (ou simplement un "ensemble de données") est utilisée pour spécifier des données conformément au modèle de données d'entrée AML, qui permet de générer un modèle, d'évaluer les performances d'un modèle, et de générer des scores de risque et l'explicabilité par partie. Pour en savoir plus, consultez Comprendre le modèle de données et les exigences relatives à l'AML.

validation des données

AML AI effectue des contrôles de validation des données lors de la création d'un ensemble de données, d'une configuration de moteur, d'un modèle, de résultats de backtests ou de résultats de prédiction. Si l'ensemble de données spécifié ne réussit pas la validation des données, la ressource n'est pas créée et des erreurs de validation des données sont générées, ce qui indique la nature du problème. Pour en savoir plus, consultez la section Erreurs de validation des données.

E

heure de fin

Les opérations d'AML basée sur l'IA qui utilisent un ensemble de données nécessitent de spécifier une heure de fin. Ce champ permet de contrôler les mois de l'ensemble de données qui sont utilisés pour générer des exemples d'entraînement ou d'évaluation et des sorties de modèle.

L'heure de fin et tous les mois utilisés pour une opération doivent être compris dans la plage de dates de l'ensemble de données associé. Par exemple, une opération d'entraînement nécessite une période principale de 15 mois. Si vous utilisez un ensemble de données dont la plage de dates est comprise entre le 15 octobre 2021 et le 21 mai 2023 et dont l'heure de fin est le 12 avril 2023, l'entraînement utilise des exemples des mois calendaires de janvier 2022 à mars 2023, qui sont compris dans la plage de dates de l'ensemble de données.

configuration du moteur

Une ressource EngineConfig de l'IA AML (également appelée "configuration du moteur") spécifie les paramètres permettant de générer et d'évaluer un modèle d'IA AML, ainsi que de générer des scores de risque et l'explicabilité.

Certains de ces paramètres sont spécifiés dans l'appel d'API pour créer une configuration de moteur, comme la version du moteur et le volume d'investigation attendu. D'autres paramètres sont automatiquement générés par l'AML basée sur l'IA à l'aide d'un ensemble de données spécifique, comme les hyperparamètres réglés. Pour en savoir plus, consultez la section Configurer un moteur.

version du moteur

Une ressource EngineVersion de l'AML basée sur l'IA (également appelée "version du moteur") définit les aspects de la détection des risques par l'AML basée sur l'IA, y compris le réglage, l'entraînement et l'évaluation des modèles, ainsi que le modèle de données et les familles de caractéristiques globaux de l'AML.

Pour configurer un moteur d'AML basée sur l'IA, vous devez spécifier la version du moteur à utiliser. La version du moteur permet ensuite d'entraîner et d'évaluer les modèles avec cette configuration de moteur, ainsi que de générer des scores de risque et l'explicabilité.

La dénomination des versions du moteur est structurée comme suit, le type de moteur exprimant le secteur d'activité accepté, et le sous-type de moteur, les réglages, les versions majeures et les versions mineures sont mis à jour à mesure que de nouveaux comportements sont mis en œuvre. Voici quelques exemples de versions : aml-retail.default.v004.000.202312-000 et aml-commercial.default.v004.000.202312-000.

Gestion des versions du moteur

Pour en savoir plus sur la gestion des versions des moteurs, consultez la page Gérer les versions des moteurs.

hors connexion

Consultez la section sur le backtesting.

explicabilité

Les modèles d'AML basés sur l'IA permettent d'identifier les parties qui présentent des comportements ou des caractéristiques présentant un risque élevé de blanchiment d'argent. L'explicabilité indique les comportements ou les caractéristiques qui ont le plus contribué à un score de risque élevé pour une partie donnée. Pour en savoir plus, consultez la section Comprendre les résultats de prédiction.

exporter les métadonnées

Plusieurs ressources d'AML basées sur l'IA stockent des informations supplémentaires sur les performances et la qualité des données. Elles sont accessibles via l'opération d'exportation des métadonnées. Pour en savoir plus, consultez la section Modèle de données de sortie AML.

F.

famille de caractéristiques

Les familles de caractéristiques sont des ensembles de caractéristiques de ML associées, fournissant une catégorisation simple et compréhensible par l'humain pour informer les enquêteurs et les équipes d'audit internes.

I

entité immuable

L'AML basée sur l'IA doit pouvoir recréer des vues des données à différents moments pour le réglage, l'entraînement et les tests en arrière-plan. Pour ce faire, l'AML basée sur l'IA fait la distinction entre les entités modifiables, c'est-à-dire les entités qui peuvent modifier les valeurs au fil du temps, et les entités immuables, telles que les événements, qui, après leur existence ou leur apparition, ne changent pas raisonnablement.

Dans le modèle de données d'entrée AML, les tables représentant des entités immuables ne contiennent pas les champs validity_start_time et is_entity_deleted. Cela inclut la table RiskCaseEvent. Pour en savoir plus, consultez Comprendre l'évolution des données au fil du temps.

Voir aussi Entité modifiable.

instance

Une ressource d'instance d'AML basée sur l'IA (également appelée "instance") se trouve à la racine de toutes les autres ressources d'IA pour la lutte contre le blanchiment d'argent (AML) et doit être créée avant que vous puissiez travailler avec d'autres ressources d'IA de lutte contre le blanchiment d'argent (AML). Vous pouvez créer plusieurs instances dans la même région au sein d'un projet. Pour en savoir plus, consultez la page Créer une instance d'AML basée sur l'IA.

processus d'investigation

Un processus d'investigation couvre l'ensemble de l'investigation ou de la séquence d'investigations déclenchées par une alerte. Le processus commence au début de la première partie d'une investigation et se termine lorsqu'aucun autre résultat n'est attendu. Pour en savoir plus, consultez la section Cycle de vie d'un cas de risque.

L

secteur d'activité

Le secteur d'activité distingue les clients des banques commerciales de détail et des banques commerciales dans le domaine de l'AML basée sur l'IA. Les ensembles de données, les versions de moteur et l'enregistrement d'une partie sont liés à un secteur d'activité spécifique, ou à un commerce ou un commerce.

opération de longue durée (LRO)

Plusieurs opérations d'AML basée sur l'IA, telles que la configuration du moteur, l'entraînement, les tests en arrière-plan et les prédictions, lancent une opération de longue durée (LRO). Pour en savoir plus, consultez la page Gérer les opérations de longue durée.

période d'analyse

En plus de la période principale, les opérations d'AML basée sur l'IA nécessitent que les ensembles de données incluent une période d'analyse pour permettre la génération de caractéristiques qui suivent le comportement au fil du temps. Pour en savoir plus, consultez Comprendre la portée et la durée des données.

M

Manquant

La métrique "Manquant" est calculée pour toutes les familles de caractéristiques lors de la création des ressources d'AML suivantes: configuration du moteur, modèle, résultats des tests backtest et résultats de la prédiction.

Cette métrique indique la part de valeurs manquantes pour l'ensemble des caractéristiques d'une famille. Un changement significatif des éléments manquants pour une famille de caractéristiques entre le réglage, l'entraînement, l'évaluation et la prédiction peut indiquer des incohérences dans les ensembles de données utilisés.

model

Une ressource de modèle d'IA AML (également appelée "modèle") représente un modèle entraîné qui peut être utilisé pour générer des scores de risque et l'explicabilité.

entité modifiable

L'AML basée sur l'IA doit pouvoir recréer des vues des données à différents moments pour le réglage, l'entraînement et les tests en arrière-plan. Pour ce faire, l'AML basée sur l'IA fait la distinction entre les entités qui peuvent modifier des valeurs au fil du temps et les entités immuables, telles que les événements, qui, lorsqu'elles viennent ou se produisent, ne changent pas raisonnablement.

Dans le modèle de données d'entrée AML, les tables représentant des entités modifiables comportent les champs validity_start_time et is_entity_deleted. Cela inclut les tables Party, AccountPartyLink, Transaction et PartySupplementaryData. Pour en savoir plus, consultez Comprendre l'évolution des données au fil du temps.

Voir aussi entité immuable.

O

rappel observé

L'AML basée sur l'IA mesure les performances du modèle sur des données historiques à l'aide de la métrique de rappel observé.

Cette métrique indique la proportion de parties positives libellées (par exemple, les sorties des clients) au cours d'une période sélectionnée qui auraient été identifiées comme présentant un risque élevé au cours d'une période d'activité suspecte par le modèle en cours d'évaluation.

P

fête

Dans le modèle de données d'entrée AML, une partie représente un client de la banque. Une partie peut être une personne physique ou une entité juridique. Pour en savoir plus, consultez le tableau Party. Voir aussi Partie enregistrée.

prédiction

La prédiction utilise un modèle pour générer des scores de risque et des explications que vous pouvez utiliser dans votre processus d'investigation en matière d'AML.

résultats de la prédiction

Une ressource PredictionResult par AML basée sur l'IA (également appelée "résultats de prédiction") correspond au résultat de l'utilisation d'un modèle pour créer des prédictions. Pour en savoir plus sur la génération de scores de risque et l'explicabilité, et sur leur utilisation dans votre processus d'investigation, consultez les pages de la section Générer des scores de risque et des explications.

R

partie enregistrée

Avant qu'une partie puisse être utilisée pour créer des résultats de prédiction (par exemple, scores de risque et explicabilité au niveau de la partie), elle doit être enregistrée pour le secteur d'activité correspondant.

cas de risque

Un cas de risque couvre un processus d'enquête ou un groupe de processus d'enquête associés à différentes parties.

Consultez le tableau RiskCaseEvent.

données d’investigation des risques

Les données d'investigation des risques sont utilisées par l'AML AI pour comprendre votre processus et vos résultats d'investigation des risques, et pour générer des étiquettes d'entraînement.

score de risque

Les modèles d'AML basés sur l'IA permettent d'identifier les parties qui présentent des comportements ou des caractéristiques présentant un risque élevé de blanchiment d'argent. Cela se fait par le biais d'un score de risque.

Les scores de risque varient de 0 à 1. Un score élevé indique un risque plus élevé. Toutefois, les scores de risque ne doivent pas être interprétés directement comme une probabilité de blanchiment d'argent. Pour en savoir plus, consultez la section Comprendre les résultats de prédiction.

typologie des risques

L'AML basée sur l'IA permet d'identifier les risques liés au blanchiment d'argent dans cinq typologies principales de risques liés à la lutte contre le blanchiment d'argent liées à la surveillance des transactions.

Avec une enquête suffisante et des données supplémentaires sur les parties (voir les tableaux Données complémentaires), l'AML basée sur l'IA peut couvrir davantage de typologies.

S

des données supplémentaires

Les données supplémentaires sont des données supplémentaires qui viennent s'ajouter aux zones données bancaires principales et données d'investigation des risques du schéma d'AML basée sur l'IA, qui sont pertinentes pour prédire les risques de blanchiment d'argent. Par exemple, vous pouvez identifier et ajouter un indicateur de risque qui aide les modèles à mieux prédire une typologie de risque qui n'est autrement pas bien couverte.

Vous pouvez ajouter des données supplémentaires à un ensemble de données à l'aide de la table PartySupplementaryData.

période d'activité suspecte

Une période d'activité suspecte est une période au cours de laquelle vous pensez qu'une personne faisant l'objet de l'enquête a fait preuve d'un comportement suspect. Cette valeur est utilisée dans l'évaluation du modèle (par exemple, la métrique de rappel pour les résultats des tests antérieurs) pour confirmer que les clients à haut risque sont identifiés au cours des mois d'activité suspecte. Pour en savoir plus, consultez la section Cycle de vie d'un cas de risque.

T

du modèle

L'AML basée sur l'IA effectue l'entraînement dans le cadre de la création d'un modèle à l'aide d'hyperparamètres (voir Réglages) à partir d'une configuration de moteur spécifiée.

réglage

Le réglage consiste à optimiser les hyperparamètres du modèle. AML AI effectue les réglages lors de la création d'une configuration de moteur.

V

heure de début de la validité

L'heure de début de validité d'une entité modifiable est utilisée par l'AML basée sur l'IA pour créer une vue de ce que la banque a connu à un moment donné. Cela permet à l'AML basée sur l'IA d'entraîner avec précision des modèles qui peuvent être réutilisés sur les dernières données (c'est-à-dire ce que la banque connaît actuellement) afin de produire des scores de risque de haute fidélité. L'heure de début de validité pour une ligne donnée représente la date la plus proche à laquelle les données de cette ligne ont été connues de la banque et correctes. Pour en savoir plus, consultez Comprendre l'évolution des données au fil du temps.