Cette page présente brièvement les concepts de l'entraînement de modèle.
Quand entraîner ou réentraîner
AML AI entraîne un modèle dans le cadre de la création d'une ressource de modèle. Le modèle doit être entraîné avant de pouvoir être évalué (c'est-à-dire, rétrotesté) ou utilisé pour générer des résultats de prédiction.
Pour optimiser les performances et maintenir les modèles les plus à jour, envisagez un réentraînement mensuel. Cependant, une version de moteur donnée permet de générer des résultats de prédiction pendant 12 mois à compter de la publication d'une nouvelle version mineure du moteur.
Comment s'entraîner
Pour entraîner un modèle (c'est-à-dire créer un modèle), consultez la page Créer et gérer des modèles.
Vous devez en particulier sélectionner les éléments suivants:
Les données à utiliser pour l'entraînement:
Spécifiez un ensemble de données et une heure de fin dans la plage de dates de l'ensemble de données.
L'entraînement utilise des libellés et des fonctionnalités basés sur des mois calendaires complets jusqu'au mois de l'heure de fin sélectionnée, mais sans compter cette information. Pour en savoir plus, consultez la section Plages de temps pour les ensembles de données.
Une configuration de moteur créée à l'aide d'un ensemble de données cohérent:
Consultez la section Configurer un moteur.
Training output
L'entraînement génère une ressource de modèle, qui permet d'effectuer les opérations suivantes:
- Créer des résultats de tests de rétrotest qui permettent d'évaluer les performances du modèle à l'aide de vrais positifs actuellement connus.
- créer des résultats de prédiction, qui seront utilisés une fois que vous serez prêt à examiner les nouveaux cas de blanchiment d'argent potentiel.
Les métadonnées du modèle contiennent la métrique suivante. Elle indique en particulier toute modification importante des familles de caractéristiques acceptées par l'ensemble de données (entre le réglage du moteur, l'entraînement, l'évaluation et la prédiction).
Nom de la métrique | Description de la métrique | Exemple de valeur de métrique |
---|---|---|
Manque de précision |
Part des valeurs manquantes pour toutes les caractéristiques de chaque famille de caractéristiques. Idéalement, le champ "Manquant" de toutes les familles de fonctionnalités AML AI doit être proche de 0. Des exceptions peuvent se produire lorsque les données sous-jacentes à ces familles de fonctionnalités ne sont pas disponibles pour l'intégration. Un changement significatif de cette valeur pour toute famille de caractéristiques entre le réglage, l'entraînement, l'évaluation et la prédiction peut indiquer des incohérences dans les ensembles de données utilisés. |
{ "featureFamilies": [ { "featureFamily": "unusual_wire_credit_activity", "missingnessValue": 0.00, }, ... ... { "featureFamily": "party_supplementary_data_id_3", "missingnessValue": 0.45, }, ], } |
Les métadonnées du modèle ne contiennent pas de métriques de rappel provenant d'un ensemble de test. Pour générer des mesures de rappel pour une période spécifique (par exemple, l'ensemble de test), consultez la section Évaluer un modèle.