Modell generieren

Auf dieser Seite werden die Konzepte des Modelltrainings kurz erläutert.

Wann sollte ich trainieren oder umziehen?

AML AI trainiert ein Modell im Rahmen der Erstellung einer Modellressource. Das Modell muss trainiert werden, bevor es ausgewertet (d. h. Backtest) oder zum Generieren von Vorhersageergebnissen verwendet werden kann.

Für eine optimale Leistung und die Wartung der neuesten Modelle sollten Sie ein monatliches erneutes Training in Betracht ziehen. Eine bestimmte Engine-Version unterstützt jedoch das Generieren von Vorhersageergebnissen ab der Veröffentlichung einer neueren Nebenversion für 12 Monate.

So trainierst du

Informationen zum Trainieren eines Modells (d. h. zum Erstellen eines Modells) finden Sie unter Modelle erstellen und verwalten.

Insbesondere müssen Sie Folgendes auswählen:

  • Für das Training zu verwendende Daten:

    Geben Sie einen Datensatz und eine Endzeit innerhalb des Datumsbereichs des Datensatzes an.

    Für das Training werden Labels und Features verwendet, die auf vollständigen Kalendermonaten bis zum Monat der ausgewählten Endzeit basieren. Weitere Informationen finden Sie unter Dataset-Zeiträume.

  • Eine Suchmaschinenkonfiguration, die mit einem konsistenten Dataset erstellt wurde:

    Weitere Informationen finden Sie unter Engine konfigurieren.

Trainingsausgabe

Beim Training wird eine Modellressource generiert, die für Folgendes verwendet werden kann:

  • Backtest-Ergebnisse erstellen, um die Modellleistung anhand aktuell bekanntermaßen richtig positiver Ergebnisse zu bewerten
  • Vorhersageergebnisse erstellen, die verwendet werden, sobald Sie bereit sind, neue Fälle für potenzielle Geldwäsche zu prüfen

Die Modellmetadaten enthalten den folgenden Messwert. Dieser Messwert zeigt insbesondere große Änderungen an den Featurefamilien, die vom Dataset unterstützt werden (zwischen Suchmaschinenoptimierung, Training, Bewertung und Vorhersage).

Messwertname Messwertbeschreibung Beispiel für Messwert
Fehlt

Anteil der fehlenden Werte bei allen Funktionen in jeder Featurefamilie.

Idealerweise sollten alle AML AI-Featurefamilien eine Fehlheit nahe 0 haben. Ausnahmen können auftreten, wenn die Daten, die diesen Featurefamilien zugrunde liegen, nicht integriert werden können.

Eine erhebliche Änderung dieses Werts für eine Featurefamilie zwischen Abstimmung, Training, Bewertung und Vorhersage kann auf Inkonsistenzen in den verwendeten Datasets hinweisen.


{
  "featureFamilies": [
    {
      "featureFamily": "unusual_wire_credit_activity",
      "missingnessValue": 0.00,
    },
    ...
    ...
    {
      "featureFamily": "party_supplementary_data_id_3",
      "missingnessValue": 0.45,
    },
  ],
}
Wichtigkeit

Messwert, der die Bedeutung einer Featurefamilie für das Modell angibt. Höhere Werte weisen auf eine stärkere Nutzung der Featurefamilie im Modell hin. Eine Featurefamilie, die im Modell nicht verwendet wird, hat keine Bedeutung.

Wichtigkeitswerte können verwendet werden, wenn Maßnahmen auf Ergebnisse von Familienverzerrungen priorisiert werden sollen. Beispielsweise muss derselbe Verzerrungswert für eine Familie mit höherer Bedeutung für das Modell dringender aufgelöst werden.


{
  "featureFamilies": [
    {
      "featureFamily": "unusual_wire_credit_activity",
      "importanceValue": 459761000000,
    },
    ...
    ...
    {
      "featureFamily": "party_supplementary_data_id_3",
      "importanceValue": 27492,
    },
  ],
}

Modellmetadaten enthalten keine Recall-Messwerte aus einem Test-Dataset. Informationen zum Generieren von Trefferquotenmessungen für einen bestimmten Zeitraum (z. B. das Test-Dataset) finden Sie unter Modell bewerten.