Générer un modèle

Cette page traite brièvement des concepts liés à l'entraînement de modèle.

Quand entraîner ou réentraîner

L'AML basée sur l'IA entraîne un modèle dans le cadre de la création d'une ressource de modèle. Le modèle doit être entraîné avant de pouvoir être évalué (c'est-à-dire d'un rétrotest) ou utilisé pour générer des résultats de prédiction.

Pour optimiser les performances et maintenir les modèles les plus à jour, envisagez un réentraînement mensuel. Cependant, une version de moteur donnée permet de générer des résultats de prédiction pendant 12 mois à compter de la publication d'une version mineure plus récente du moteur.

Comment s'entraîner

Pour entraîner un modèle (c'est-à-dire créer un modèle), consultez la page Créer et gérer des modèles.

Vous devez notamment sélectionner les éléments suivants:

  • Les données à utiliser pour l'entraînement:

    Spécifiez un ensemble de données et une heure de fin dans la plage de dates de l'ensemble de données.

    L'entraînement utilise des libellés et des fonctionnalités basés sur des mois calendaires complets jusqu'au mois de l'heure de fin sélectionnée (non inclus). Pour en savoir plus, consultez la section Plages de dates de l'ensemble de données.

  • Une configuration de moteur créée à l'aide d'un ensemble de données cohérent:

    Consultez Configurer un moteur.

Training output

L'entraînement génère une ressource de modèle, qui peut être utilisée pour effectuer les opérations suivantes:

  • Créer des résultats de rétrotests utilisés pour évaluer les performances du modèle à l'aide de vrais positifs connus
  • créer des résultats de prédiction, qui seront utilisés une fois que vous serez prêt à examiner les nouveaux cas de blanchiment d'argent potentiel.

Les métadonnées du modèle contiennent la métrique suivante. En particulier, cette métrique vous indique toute modification importante des familles de caractéristiques prises en charge par l'ensemble de données (entre le réglage du moteur, l'entraînement, l'évaluation et la prédiction).

Nom de la métrique Description de la métrique Exemple de valeur de métrique
Manquant

Part des valeurs manquantes pour toutes les caractéristiques de chaque famille de caractéristiques.

Idéalement, le champ "Manquant" de toutes les familles de caractéristiques d'IA de l'AML doit être proche de 0. Des exceptions peuvent se produire lorsque les données sous-jacentes à ces familles de caractéristiques ne sont pas disponibles pour l'intégration.

Un changement significatif de cette valeur pour une famille de caractéristiques entre le réglage, l'entraînement, l'évaluation et la prédiction peut indiquer des incohérences dans les ensembles de données utilisés.


{
  "featureFamilies": [
    {
      "featureFamily": "unusual_wire_credit_activity",
      "missingnessValue": 0.00,
    },
    ...
    ...
    {
      "featureFamily": "party_supplementary_data_id_3",
      "missingnessValue": 0.45,
    },
  ],
}
Importance

Métrique qui montre l'importance d'une famille de caractéristiques pour le modèle. Des valeurs plus élevées indiquent une utilisation plus significative de la famille de caractéristiques dans le modèle. Une famille de caractéristiques non utilisée dans le modèle a une importance nulle.

Les valeurs d'importance peuvent être utilisées pour prioriser l'action sur les résultats du décalage familial. Par exemple, il est plus urgent de résoudre le même décalage pour une famille ayant une importance plus élevée pour le modèle.


{
  "featureFamilies": [
    {
      "featureFamily": "unusual_wire_credit_activity",
      "importanceValue": 459761000000,
    },
    ...
    ...
    {
      "featureFamily": "party_supplementary_data_id_3",
      "importanceValue": 27492,
    },
  ],
}

Les métadonnées du modèle ne contiennent pas de métriques de rappel provenant d'un ensemble de test. Pour générer des mesures de rappel pour une période spécifique (par exemple, l'ensemble de test), consultez la section Évaluer un modèle.