Auf dieser Seite werden die Konzepte hinter dem Modelltraining kurz erläutert. Eine AML-KI-Modellressource ist ein trainiertes Modell, mit dem Risikobewertungen und Erklärbarkeit generiert werden können.
Wann sollten trainiert oder umsteigen?
AML AI trainiert ein Modell beim Erstellen eines Modellressource. Das Modell muss trainiert werden, bevor es ausgewertet (d. h. zurückgetestet) oder zum Generieren von Vorhersageergebnissen verwendet werden kann.
Um die beste Leistung zu erzielen und Ihre Modelle auf dem neuesten Stand zu halten, sollten Sie neue Schulung. Eine bestimmte Engine-Version unterstützt jedoch das Generieren die Prognoseergebnisse für 12 Monate einer neueren Nebenversion der Engine.
So trainieren Sie
Informationen zum Trainieren eines Modells (d. h. zum Erstellen eines Modells) finden Sie unter Modelle erstellen und verwalten
Wählen Sie insbesondere Folgendes aus:
Für das Training zu verwendende Daten:
Geben Sie einen Datensatz und eine Endzeit innerhalb des Zeitraums des Datensatzes an.
Beim Training werden Labels und Funktionen anhand von abgeschlossenen Kalendermonaten bis zu ohne den Monat des ausgewählten Endes. Weitere Informationen finden Sie unter Zeiträume für Datasets.
Eine Engine-Konfiguration, die mit einem einheitlichen Dataset erstellt wurde:
Weitere Informationen finden Sie unter Engine konfigurieren.
Trainingsausgabe
Beim Training wird eine Modellressource generiert, die für Folgendes verwendet werden kann:
- Backtest-Ergebnisse erstellen, mit denen die Modellleistung anhand derzeit bekannte richtig positive Ergebnisse
- Erstellen Sie Vorhersageergebnisse, die verwendet werden, sobald Sie bereit sind. Prüfung neuer Fälle zu möglicher Geldwäsche
Die Modellmetadaten enthalten den Messwert missingness
, mit dem die Datensatzkonsistenz bewertet werden kann (z. B. durch Vergleich der Werte für fehlende Werte von Featurefamilien aus verschiedenen Vorgängen).
Messwertname | Beschreibung des Messwerts | Beispiel für einen Messwert |
---|---|---|
Fehlen |
Anteil der fehlenden Werte für alle Features in jeder Featurefamilie. Idealerweise sollte der Wert für alle AML-KI-Funktionsfamilien nahe 0 liegen. Ausnahmen können auftreten, wenn die Daten, die diesen Funktionsfamilien zugrunde liegen, nicht für die Einbindung verfügbar sind. Eine erhebliche Änderung dieses Werts für eine beliebige Funktionsfamilie zwischen Optimierung, Training, Bewertung und Vorhersage kann auf Inkonsistenzen in den verwendeten Datensätzen hinweisen. |
{ "featureFamilies": [ { "featureFamily": "unusual_wire_credit_activity", "missingnessValue": 0.00, }, ... ... { "featureFamily": "party_supplementary_data_id_3", "missingnessValue": 0.45, }, ], } |
Wichtigkeit |
Eine Messzahl, die die Wichtigkeit einer Feature-Familie für das Modell angibt. Höhere Werte weisen auf eine stärkere Nutzung der Feature-Familie im Modell hin. Eine Feature-Familie, die im Modell nicht verwendet wird, hat keine Bedeutung. Mithilfe von Wichtigkeitswerten können Sie festlegen, welche Maßnahmen bei Ergebnissen mit Familienverzerrung priorisiert werden sollen. Beispielsweise ist es dringender, denselben Schiefewert für eine Familie zu beheben, die für das Modell eine größere Bedeutung hat. |
{ "featureFamilies": [ { "featureFamily": "unusual_wire_credit_activity", "importanceValue": 459761000000, }, ... ... { "featureFamily": "party_supplementary_data_id_3", "importanceValue": 27492, }, ], } |
Modellmetadaten enthalten keine Recall-Messwerte aus einem Test-Dataset. Informationen zum Erstellen von Abrufmessungen für einen bestimmten Zeitraum (z. B. den Testsatz) finden Sie unter Modell bewerten.