Générer un modèle

Cette page présente brièvement les concepts de l'entraînement de modèle. Une AML basée sur l'IA ressource de modèle représente un modèle entraîné pouvant être utilisé pour générer un risque les scores et l'explicabilité.

Quand entraîner ou réentraîner le modèle ?

L'AML basée sur l'IA entraîne un modèle pour créer Ressource de modèle. Le modèle doit être entraîné avant de pouvoir être évalué (c'est-à-dire testé en arrière) ou utilisé pour générer des résultats de prédiction.

Pour des performances optimales et pour conserver les modèles les plus à jour, envisagez de les réentraîner tous les mois. Cependant, une version de moteur donnée permet de générer résultats de prédiction sur 12 mois d'une nouvelle version mineure du moteur.

S'entraîner

Pour entraîner un modèle (c'est-à-dire créer un modèle), consultez Créer et gérer des modèles

Vous devez notamment sélectionner les éléments suivants:

  • Données à utiliser pour l'entraînement :

    Spécifiez un ensemble de données et une heure de fin comprise dans la période de l'ensemble de données.

    L'entraînement utilise des étiquettes et des fonctionnalités basées sur des mois calendaires complets jusqu'au (à l'exclusion du mois correspondant à l'heure de fin sélectionnée) Pour plus d'informations, voir Périodes d'utilisation des ensembles de données.

  • Configuration de moteur créée à partir d'un ensemble de données cohérent:

    Consultez la section Configurer un moteur.

Training output

L'entraînement génère Ressource de modèle, qui peut permet d'effectuer les opérations suivantes:

  • Créer des résultats de backtest qui permettent d'évaluer les performances du modèle à l'aide de vrais positifs actuellement connus
  • Créer des résultats de prédiction à utiliser une fois que vous êtes prêt à commencer Examen de nouvelles affaires de blanchiment d'argent potentiel

Les métadonnées du modèle contiennent la métrique missingness, qui peut être utilisée pour évaluer la consistance de l'ensemble de données (par exemple, en comparant les valeurs de manque des familles d'éléments géographiques de différentes opérations).

Nom de la métrique Description de la métrique Exemple de valeur de métrique
Manquant

Pourcentage de valeurs manquantes pour toutes les entités de chaque famille d'entités.

Dans l'idéal, toutes les familles de fonctionnalités d'AML basée sur l'IA devraient Manquante proche de 0. Des exceptions peuvent se produire lorsque les données sous-jacentes ces familles de caractéristiques ne peuvent pas être intégrées.

Un changement significatif de cette valeur pour toute famille de caractéristiques entre le réglage l'entraînement, l'évaluation et la prédiction peuvent indiquer des incohérences les ensembles de données utilisés.

{
  "featureFamilies": [
    {
      "featureFamily": "unusual_wire_credit_activity",
      "missingnessValue": 0.00,
    },
    ...
    ...
    {
      "featureFamily": "party_supplementary_data_id_3",
      "missingnessValue": 0.45,
    },
  ],
}
Importance

Métrique qui indique l'importance d'une famille de caractéristiques pour le modèle. Plus les valeurs sont élevées, plus l'utilisation de la famille de fonctionnalités est importante dans le modèle. Une famille de caractéristiques qui n'est pas utilisée dans le modèle n'a aucune importance.

Les valeurs d'importance peuvent être utilisées pour hiérarchiser les actions à effectuer en fonction des résultats de biais familiaux. Par exemple, une valeur de biais identique pour une famille plus importante pour le modèle doit être résolue plus rapidement.

{
  "featureFamilies": [
    {
      "featureFamily": "unusual_wire_credit_activity",
      "importanceValue": 459761000000,
    },
    ...
    ...
    {
      "featureFamily": "party_supplementary_data_id_3",
      "importanceValue": 27492,
    },
  ],
}

Les métadonnées du modèle ne contiennent pas les métriques de rappel d'un ensemble de test. Pour générer des mesures de rappel pour une période donnée (par exemple, l'ensemble de test), consultez Évaluer un modèle