Auf dieser Seite werden die Konzepte hinter dem Modelltraining kurz erläutert. Eine AML-KI-Modellressource ist ein trainiertes Modell, mit dem Risikobewertungen und Erklärbarkeit generiert werden können.
Wann Sie ein Modell trainieren oder neu trainieren sollten
AML AI trainiert ein Modell im Rahmen der Erstellung einer Modellressource. Das Modell muss trainiert werden, bevor es bewertet (d. h. zurückgetestet) oder zum Generieren von Vorhersageergebnissen verwendet werden kann.
Für eine optimale Leistung und um immer die aktuellsten Modelle zu verwenden, sollten Sie das Modell monatlich neu trainieren. Eine bestimmte Engine-Version unterstützt jedoch die Generierung von Prognoseergebnissen für 12 Monate nach der Veröffentlichung einer neueren Engine-Nebenversion.
So trainieren Sie
Informationen zum Trainieren eines Modells (d. h. zum Erstellen eines Modells) finden Sie unter Modelle erstellen und verwalten.
Insbesondere müssen Sie Folgendes auswählen:
Für das Training zu verwendende Daten:
Geben Sie einen Datensatz und eine Endzeit innerhalb des Zeitraums des Datensatzes an.
Für die Ausbildung werden Labels und Funktionen für vollständige Kalendermonate bis zum Monat des ausgewählten Endzeitpunkts verwendet, dieser Monat ist jedoch nicht inbegriffen. Weitere Informationen finden Sie unter Zeiträume für Datasets.
Eine Engine-Konfiguration, die mit einem konsistenten Datensatz erstellt wurde:
Weitere Informationen finden Sie unter Engine konfigurieren.
Trainingsausgabe
Beim Training wird eine Modellressource generiert, die für Folgendes verwendet werden kann:
- Backtestergebnisse erstellen, die zur Bewertung der Modellleistung anhand derzeit bekannter richtig-positiver Ergebnisse verwendet werden
- Erstellen Sie Vorhersageergebnisse, die verwendet werden, sobald Sie neue Fälle auf potenzielle Geldwäsche prüfen möchten.
Die Modellmetadaten enthalten den Messwert missingness
, mit dem die Datensatzkonsistenz bewertet werden kann (z. B. durch Vergleich der Werte für fehlende Werte von Featurefamilien aus verschiedenen Vorgängen).
Messwertname | Beschreibung des Messwerts | Beispiel für einen Messwert |
---|---|---|
Fehlende Werte |
Anteil der fehlenden Werte bei allen Features in jeder Feature-Familie. Idealerweise sollte der Wert für alle AML-KI-Funktionsfamilien nahe 0 liegen. Ausnahmen können auftreten, wenn die Daten, die diesen Funktionsfamilien zugrunde liegen, nicht für die Einbindung verfügbar sind. Eine erhebliche Änderung dieses Werts für eine beliebige Funktionsfamilie zwischen Optimierung, Training, Bewertung und Vorhersage kann auf Inkonsistenzen in den verwendeten Datensätzen hinweisen. |
{ "featureFamilies": [ { "featureFamily": "unusual_wire_credit_activity", "missingnessValue": 0.00, }, ... ... { "featureFamily": "party_supplementary_data_id_3", "missingnessValue": 0.45, }, ], } |
Wichtigkeit |
Eine Messzahl, die die Wichtigkeit einer Feature-Familie für das Modell angibt. Höhere Werte deuten auf eine stärkere Nutzung der Merkmalsfamilie im Modell hin. Eine Merkmalsfamilie, die im Modell nicht verwendet wird, hat eine Wichtigkeit von null. Mithilfe von Wichtigkeitswerten können Sie festlegen, welche Maßnahmen bei Ergebnissen mit Familienverzerrung priorisiert werden sollen. Beispielsweise ist es dringender, denselben Schiefewert für eine Familie zu beheben, die für das Modell eine größere Bedeutung hat. |
{ "featureFamilies": [ { "featureFamily": "unusual_wire_credit_activity", "importanceValue": 459761000000, }, ... ... { "featureFamily": "party_supplementary_data_id_3", "importanceValue": 27492, }, ], } |
Die Modellmetadaten enthalten keine Recall-Messwerte aus einem Testsatz. Informationen zum Erstellen von Abrufmessungen für einen bestimmten Zeitraum (z. B. den Testsatz) finden Sie unter Modell bewerten.