AML AI-Glossar

In diesem Glossar werden Begriffe speziell für AML AI definiert. Allgemeine Begriffe zum maschinellen Lernen finden Sie im Glossar zum maschinellen Lernen.

B

Backtesting

Beim Backtesting werden Verlaufsdaten verwendet, um die Leistung eines Modells (beobachtete Recall) zu bewerten. Dazu werden die generierten Risikobewertungen mit den tatsächlichen Ergebnissen historischer Untersuchungen verglichen.

Backtest-Ergebnisse

Eine BacktestResult-Ressource von AML AI (auch als „Backtest-Ergebnisse“ bezeichnet) wird erstellt, um die Leistung eines model für ein Dataset zu testen. Weitere Informationen finden Sie unter Modell bewerten.

C

Kern-Banking-Daten

Kernbankdaten umfassen Daten zu Parteien, Transaktionen und Kontobeständen. Sie hilft AML AI, Ihre Kunden und ihre Bankaktivitäten zu verstehen, um riskante Merkmale und Verhaltensweisen zu erkennen.

Kernzeitfenster

Das Kernzeitfenster bezieht sich auf den Zeitraum, der in einem AML-KI-Vorgang (Engine-Konfiguration, Training, Backtesting und Vorhersage) zum Generieren von Trainings, Bewertungsbeispielen oder Modellausgaben verwendet wird. Dieser Zeitraum muss durch alle Tabellen im Dataset abgedeckt sein.

Verschiedene API-Vorgänge stellen unterschiedliche Anforderungen an das Kernzeitfenster zum Generieren von Funktionen und Labels. Weitere Informationen finden Sie unter Datenumfang und -dauer.

D

Dataset

Eine Dataset-Ressource von AML AI (oder einfach „Dataset“) wird zum Angeben von Daten verwendet, entsprechend dem AML-Eingabedatenmodell, das zum Generieren eines Modells, zum Bewerten der Leistung eines Modells sowie zum Generieren von Risikobewertungen und Erklärbarkeit pro Partei verwendet werden kann. Weitere Informationen findest du unter Das AML-Datenmodell und die Anforderungen verstehen.

Datenvalidierung

AML AI führt Datenvalidierungsprüfungen durch, wenn ein Dataset, eine Engine-Konfiguration, ein Modell, Backtest-Ergebnisse oder Vorhersageergebnisse erstellt werden. Wenn das angegebene Dataset die Datenvalidierung nicht besteht, wird die Ressource nicht erstellt und Datenvalidierungsfehler erzeugt (die auf die Art des Problems hinweisen). Weitere Informationen finden Sie unter Datenvalidierungsfehler.

E

Endzeit

Bei AML AI-Vorgängen, die ein Dataset verwenden, müssen Sie ein Ende angeben. Mit diesem Feld wird gesteuert, welche Monate im Dataset zum Generieren von Trainings- oder Bewertungsbeispielen und Modellausgaben verwendet werden.

Das Ende und alle für einen Vorgang verwendeten Monate müssen im Datumsbereich des zugehörigen Datasets liegen. Für einen Trainingsvorgang ist beispielsweise ein Kernzeitfenster von 15 Monaten erforderlich. Wenn Sie ein Dataset mit einem Zeitraum vom 15. Oktober 2021 bis 21. Mai 2023 und einer Endzeit am 12. April 2023 verwenden, werden für das Training Beispiele aus den Kalendermonaten Januar 2022 bis März 2023 verwendet, die im Datumsbereich des Datasets liegen.

Suchmaschinenkonfiguration

Eine EngineConfig-Ressource von AML AI (auch als „Engine-Konfiguration“ bezeichnet) gibt Parameter zum Generieren und Bewerten eines AML AI-Modells sowie beim Generieren von Risikobewertungen und Erklärbarkeit an.

Einige dieser Parameter werden im API-Aufruf angegeben, um eine Engine-Konfiguration zu erstellen, z. B. die Engine-Version und das erwartete Untersuchungsvolumen. Andere Parameter werden von AML AI mithilfe eines angegebenen Datasets, z. B. abgestimmter Hyperparameter, automatisch generiert. Weitere Informationen finden Sie unter Engine konfigurieren.

Suchmaschinenversion

Eine EngineVersion-Ressource von AML AI (auch als „Engine-Version“ bezeichnet) definiert Aspekte der Art und Weise, wie AML AI Risiken erkennt. Dies umfasst die Modellabstimmung, das Training und die Bewertung sowie das gesamte AML-Datenmodell und die Featurefamilien.

Zum Konfigurieren einer AML AI-Engine müssen Sie eine zu verwendende Engine-Version angeben. Die Engine-Version wird dann verwendet, um Modelle mit dieser Engine-Konfiguration zu trainieren und zu bewerten sowie Risikobewertungen und Erklärbarkeit zu generieren.

Die Engine-Versionsbenennung ist so strukturiert, wobei der Engine-Typ den unterstützten Geschäftsbereich ausdrückt und der Engine-Untertyp, die Feinabstimmung sowie die Haupt- und Nebenversionen aktualisiert werden, sobald neue Verhaltensweisen implementiert werden. Beispielversionen sind aml-retail.default.v004.000.202312-000 und aml-Commercial.default.v004.000.202312-000.

Suchmaschinenversionsverwaltung

Weitere Informationen zum Verwalten von Engine-Versionen finden Sie unter Engine-Versionen verwalten.

Kennenlernen

Siehe Backtesting.

Erklärbarkeit

AML AI-Modelle werden verwendet, um Parteien zu identifizieren, die Verhaltensweisen oder Merkmale mit einem hohen Risiko für Geldwäsche zeigen. Die Erklärbarkeit gibt an, welche Verhaltensweisen oder Merkmale am meisten zu einem hohen Risikowert für eine bestimmte Partei beigetragen haben. Weitere Informationen finden Sie unter Vorhersageausgaben verstehen.

Metadaten exportieren

Verschiedene AML AI-Ressourcen speichern zusätzliche Informationen zur Leistung und Datenqualität, auf die mit dem Export von Metadaten zugegriffen werden kann. Weitere Informationen finden Sie unter AML-Ausgabedatenmodell.

F

Featurefamilie

Featurefamilien sind Sammlungen verwandter ML-Features, die eine für Menschen verständliche Kategorisierung ermöglichen, um Ermittler und interne Auditteams zu informieren.

I

unveränderliche Entität

AML AI muss in der Lage sein, Ansichten der Daten zu verschiedenen Zeitpunkten für Feinabstimmung, Training und Backtests neu zu erstellen. Um dies zu erreichen, unterscheidet AML AI zwischen änderbaren Entitäten, d. h. Entitäten, die sich im Laufe der Zeit ändern können, und unveränderlichen Entitäten wie Ereignissen, die sich, nachdem sie existieren oder eintreten, nicht vernünftigerweise ändern.

Im AML-Eingabedatenmodell haben Tabellen, die unveränderliche Entitäten darstellen, nicht die Felder validity_start_time und is_entity_deleted. Dazu gehört auch die Tabelle RiskCaseEvent. Weitere Informationen finden Sie unter Datenänderungen im Zeitverlauf verstehen.

Siehe auch änderbare Entität.

Instanz

Eine AML AI-Instanzressource (auch als „Instanz“ bezeichnet) befindet sich auf der Stammebene aller anderen AML AI-Ressourcen und muss erstellt werden, bevor Sie mit anderen AML AI-Ressourcen arbeiten können. Innerhalb eines Projekts können mehrere Instanzen in derselben Region erstellt werden. Weitere Informationen finden Sie unter AML AI-Instanz erstellen.

Untersuchungsprozess

Ein Untersuchungsprozess umfasst die gesamte Prüfung oder die Abfolge von Prüfungen, die durch eine Benachrichtigung ausgelöst werden. Der Prozess beginnt, wenn der erste Teil einer Untersuchung beginnt, und endet, wenn keine weiteren Ergebnisse von der Untersuchung erwartet werden. Weitere Informationen finden Sie unter Lebenszyklus eines Risikofalls.

L

Line of Business (Sparte des Geschäftsbereichs)

Der Geschäftsbereich unterscheidet zwischen Privat- und Geschäftsbanken in AML AI. Datasets, Engine-Versionen und die Parteiregistrierung sind mit einer bestimmten Branche, einem bestimmten Einzelhandel oder einem bestimmten Gewerbe verknüpft.

Vorgang mit langer Ausführungszeit (Long-Running Operation, LRO)

Mehrere AML AI-Vorgänge, einschließlich Engine-Konfiguration, Training, Backtests und Vorhersage, initiieren einen Vorgang mit langer Ausführungszeit. Weitere Informationen finden Sie unter Lang andauernde Vorgänge verwalten.

Lookback-Window

Zusätzlich zum Kernzeitfenster müssen Datasets für AML AI-Vorgänge ein Lookback-Window enthalten, damit Funktionen generiert werden können, die das Verhalten im Zeitverlauf verfolgen. Weitere Informationen finden Sie unter Datenumfang und -dauer.

M

Fehlt

Der Messwert „Fehlheit“ wird für alle Featurefamilien berechnet, wenn die folgenden AML AI-Ressourcen erstellt werden: Engine-Konfiguration, Modell, Backtest-Ergebnisse und Vorhersageergebnisse.

Dieser Messwert zeigt den Anteil der fehlenden Werte für alle Features einer Featurefamilie. Eine erhebliche Änderung des „Fehlheitsgrads“ für eine Featurefamilie zwischen Abstimmung, Training, Bewertung und Vorhersage kann auf Inkonsistenzen in den verwendeten Datasets hinweisen.

model

Eine AML AI-Modellressource (auch als „Modell“ bezeichnet) stellt ein trainiertes Modell dar, das zum Generieren von Risikobewertungen und Erklärbarkeit verwendet werden kann.

änderbare Entität

AML AI muss in der Lage sein, Ansichten der Daten zu verschiedenen Zeitpunkten für Feinabstimmung, Training und Backtests neu zu erstellen. Um dies zu erreichen, unterscheidet AML AI zwischen Entitäten, die sich Werte im Laufe der Zeit ändern können, und unveränderlichen Entitäten wie Ereignissen, die sich, wenn sie existieren oder eintreten, nicht angemessen ändern.

Im AML-Eingabedatenmodell haben Tabellen, die änderbare Entitäten darstellen, die Felder validity_start_time und is_entity_deleted. Dazu gehören die Tabellen Party, AccountPartyLink, Transaction und PartySupplementaryData. Weitere Informationen finden Sie unter Datenänderungen im Zeitverlauf verstehen.

Siehe auch Unveränderliche Entität.

O

beobachteter Recall

AML AI misst die Modellleistung anhand von Verlaufsdaten mithilfe des Messwerts „Beobachtete Recall“.

Dieser Messwert zeigt den Anteil der positiven gekennzeichneten Parteien (z. B. Kundenausstiege) in einem ausgewählten Zeitraum, die während eines Zeitraums mit verdächtiger Aktivität von dem zu bewertenden Modell als hohes Risiko identifiziert worden wären.

P

Partei

Im AML-Eingabedatenmodell stellt eine Partei einen Kunden der Bank dar. Eine Partei kann eine natürliche Person oder eine juristische Person sein. Weitere Informationen finden Sie in der Partytabelle. Siehe auch Registrierte Partei.

Vorhersage

Die Vorhersage verwendet ein Modell, um Risikobewertungen und Erklärbarkeit zu generieren, die in Ihrem AML-Untersuchungsprozess verwendet werden können.

Vorhersageergebnisse

Eine PredictionResult-Ressource von AML AI (auch als "Vorhersageergebnisse" bezeichnet) ist das Ergebnis der Verwendung eines Modells zum Erstellen von Vorhersagen. Weitere Informationen zum Generieren von Risikobewertungen und Erklärbarkeit sowie zu ihrer Verwendung im Untersuchungsprozess finden Sie auf den Seiten im Abschnitt Risikobewertungen und Erklärbarkeit generieren.

R

registrierte Partei

Bevor eine Partei zum Erstellen von Vorhersageergebnissen (z. B. Risikobewertungen und Erklärbarkeit auf Parteiebene) verwendet werden kann, muss sie für den entsprechenden Geschäftsbereich registriert sein.

Risikofall

Ein Risikofall umfasst einen Untersuchungsprozess oder eine Gruppe verwandter Untersuchungsprozesse für verschiedene Parteien.

Weitere Informationen finden Sie in der Tabelle RiskCaseEvent.

Daten zur Risikountersuchung

AML AI verwendet Risikountersuchungsdaten, um den Prozess und die Ergebnisse Ihrer Risikountersuchung zu verstehen und Trainingslabels zu generieren.

Risikobewertung

AML AI-Modelle werden verwendet, um Parteien zu identifizieren, die Verhaltensweisen oder Merkmale mit einem hohen Risiko für Geldwäsche zeigen. Dies geschieht über einen Risiko-Score.

Die Risikobewertungen liegen zwischen 0 und 1. Eine höhere Punktzahl weist auf ein höheres Risiko hin. Risikobewertungen sollten jedoch nicht direkt als Wahrscheinlichkeit von Geldwäscheaktivitäten interpretiert werden. Weitere Informationen finden Sie unter Vorhersageausgaben verstehen.

Risikotypologie

AML AI kann das Geldwäscherisiko anhand von fünf wichtigsten AML-Risikotypologien im Zusammenhang mit dem Transaktionsmonitoring identifizieren.

Wenn genügend Untersuchungs- und ergänzende Daten von Dritten vorhanden sind (siehe Tabellen mit ergänzenden Daten), kann AML AI mehr Typologien abdecken.

S

ergänzende Daten

Zusätzliche Daten sind zusätzliche Daten, die über die Bereiche Kerndaten für Bankdaten und Risikountersuchungsdaten des AML AI-Schemas hinausgehen und für die Vorhersage des Risikos von Geldwäsche relevant sind. Sie können beispielsweise einen Risikoindikator identifizieren und hinzufügen, mit dem Modelle eine Risikotypologie besser vorhersagen können, die ansonsten nicht gut abgedeckt wird.

Mit der Tabelle PartySupplementaryData können zusätzliche Daten zu einem Dataset hinzugefügt werden.

Zeitraum für verdächtige Aktivitäten

Ein Zeitraum für verdächtige Aktivitäten ist ein Zeitraum, in dem Sie der Meinung sind, dass ein untersuchter Dritter verdächtiges Verhalten gezeigt hat. Dies wird bei der Modellbewertung verwendet (z. B. der Recall-Messwert für Backtest-Ergebnisse), um zu bestätigen, dass Kunden mit hohem Risiko in den Monaten identifiziert werden, in denen sie verdächtige Aktivitäten hatten. Weitere Informationen finden Sie unter Lebenszyklus eines Risikofalls.

T

Training

AML AI führt das Training im Rahmen der Erstellung eines Modells mit Hyperparametern (siehe Abstimmung) aus einer angegebenen Engine-Konfiguration durch.

Abstimmung

Abstimmung ist die Optimierung von Modell-Hyperparametern. AML AI führt eine Feinabstimmung durch, wenn eine Engine-Konfiguration erstellt wird.

V

Beginn der Gültigkeit

Die Startzeit der Gültigkeit für eine änderbare Entität wird von AML AI verwendet, um eine Ansicht der Informationen zu erstellen, die der Bank zu einem bestimmten Zeitpunkt bekannt waren. Dadurch kann AML AI Modelle genau trainieren, die mit den neuesten Daten (also den aktuell der Bank bekannten Daten) wiederverwendet werden können, um High-Fidelity-Risikobewertungen zu erstellen. Der Beginn der Gültigkeit für eine bestimmte Zeile steht für den frühesten Zeitpunkt, zu dem die Daten in dieser Zeile der Bank bekannt waren und korrekt waren. Weitere Informationen finden Sie unter Datenänderungen im Zeitverlauf verstehen.