Glossar zu AML AI

In diesem Glossar werden Begriffe definiert, die speziell für KI in der Geldwäscheprävention gelten. Allgemeine Begriffe zum Thema maschinelles Lernen finden Sie im Glossar zum maschinellen Lernen.

A

ADC

Jede der API-Clientbibliotheken bietet die Möglichkeit, lokale Standardanmeldedaten für Anwendungen (Application Default Credentials, ADC) zu verwenden.

Informationen zum Unterschied zwischen Ihren lokalen ADC-Anmeldedaten und Ihren gcloud CLI-Anmeldedaten finden Sie unter Anmeldedaten für die gcloud CLI und ADC.

B

backtesting
Beim Backtesting werden Verlaufsdaten verwendet, um die Leistung (beobachtete Trefferquote) eines Modells zu bewerten. Dazu wird der generierte Risikowert mit den tatsächlichen Ergebnissen früherer Tests verglichen.
Backtest-Ergebnisse
Eine AML-KI-BacktestResult-Ressource (auch als „Backtest-Ergebnisse“ bezeichnet) wird erstellt, um die Leistung eines Modells anhand eines Datasets zu testen.
Weitere Informationen finden Sie unter Modell bewerten.

C

Kernbankdaten
Kernbankendaten umfassen Daten zu Parteien, Transaktionen und Kontobeständen. So kann die AML-KI Ihre Kunden und ihre Bankaktivitäten besser verstehen, um riskante Merkmale und Verhaltensweisen zu erkennen.
Kernzeitfenster

Das Kernzeitfenster bezieht sich auf den Zeitraum, der bei einer AML-KI-Operation (Enginekonfiguration, Training, Backtesting und Vorhersage) zum Generieren von Trainings-, Bewertungsbeispielen oder Modellergebnissen verwendet wird. Dieser Zeitraum muss von allen Tabellen im Dataset abgedeckt sein.

Für verschiedene API-Vorgänge gelten unterschiedliche Anforderungen an das Kernzeitfenster für die Generierung von Funktionen und Labels. Weitere Informationen finden Sie unter Umfang und Dauer der Daten.

Weitere Informationen finden Sie unter Lookback-Window.

D

Datenvalidierung
AML AI führt Datenvalidierungsüberprüfungen beim Erstellen eines Datensatzes, einer Engine-Konfiguration, eines Modells, von Backtestergebnissen oder Vorhersageergebnissen durch. Wenn der angegebene Datensatz die Datenvalidierung nicht besteht, wird die Ressource nicht erstellt und es werden Datenvalidierungsfehler ausgegeben, die die Art des Problems angeben.
Weitere Informationen finden Sie unter Fehler bei der Datenvalidierung.
Dataset

Mit einer Dataset-Ressource für AML-KI (oder einfach „Dataset“) werden Daten gemäß dem AML-Eingabedatenmodell angegeben, die zum Generieren eines Modells, zum Bewerten der Leistung eines Modells und zum Generieren von Risikobewertungen und Erklärbarkeit pro Partei verwendet werden können.

Weitere Informationen finden Sie unter AML-Datenmodell und -Anforderungen.

E

Endzeit

Bei AML-KI-Vorgängen, bei denen ein Datensatz verwendet wird, müssen Sie ein Enddatum angeben. In diesem Feld wird festgelegt, welche Monate im Datensatz zum Generieren von Trainings- oder Bewertungsbeispielen und Modellergebnissen verwendet werden.

Die Endzeit und alle für einen Vorgang verwendeten Monate müssen in den Zeitraum des zugehörigen Datensatzes fallen.

Für einen Trainingsvorgang ist beispielsweise ein Hauptzeitraum von 15 Monaten erforderlich. Wenn Sie ein Dataset mit dem Zeitraum 15. Oktober 2021 bis 21. Mai 2023 und dem Enddatum 12. April 2023 verwenden, werden für das Training Beispiele aus den Kalendermonaten Januar 2022 bis März 2023 verwendet, die in den Zeitraum des Datasets fallen.

engine config

Eine EngineConfig-Ressource für AML-KI (auch als „Engine-Konfiguration“ bezeichnet) gibt Parameter für die Generierung und Bewertung eines AML-KI-Modells sowie für die Generierung von Risikobewertungen und Erklärbarkeit an.

Einige dieser Parameter werden im API-Aufruf angegeben, um eine Engine-Konfiguration zu erstellen, z. B. die Engine-Version und das erwartete Untersuchungsvolumen. Andere Parameter werden automatisch von AML AI anhand eines angegebenen Datasets generiert, z. B. abgestimmte Hyperparameter.

Weitere Informationen finden Sie unter Einen Engine konfigurieren.

Engine-Version

Mit einer EngineVersion-Ressource (auch als „Engine-Version“ bezeichnet) für die AML-KI werden Aspekte der Risikoerkennung durch die AML-KI definiert. Dazu gehören die Modelloptimierung, das Training und die Bewertung sowie das gesamte AML-Datenmodell und die Featurefamilien.

Wenn Sie eine AML-KI-Engine konfigurieren, müssen Sie eine zu verwendende Engine-Version angeben. Die Engine-Version wird dann verwendet, um Modelle mit dieser Engine-Konfiguration zu trainieren und zu bewerten sowie Risikobewertungen und Erklärbarkeit zu generieren.

Die Benennung der Engine-Version ist folgendermaßen strukturiert: Der Engine-Typ gibt die unterstützte Branche an. Engine-Subtyp, Tuning, Hauptversion und Nebenversion werden aktualisiert, wenn neue Verhaltensweisen implementiert werden.

Beispiele für Versionen:

  • aml-retail.default.v004.000.202312-000
  • aml-commercial.default.v004.000.202312-000
Engine-Version

Weitere Informationen zum Verwalten von Engine-Versionen finden Sie unter Engine-Versionen verwalten.

Bewertung

Siehe auch backtesting.

Erklärbarkeit

AML-KI-Modelle werden verwendet, um Parteien zu identifizieren, die Verhaltensweisen oder Merkmale mit hohem Risiko für Geldwäsche aufweisen. Die Erklärbarkeit gibt an, welche Verhaltensweisen oder Merkmale am stärksten zu einem hohen Risikowert für eine bestimmte Partei beigetragen haben.

Weitere Informationen finden Sie unter Vorhersageergebnisse verstehen.

Siehe auch Vorhersage.

Metadaten exportieren

In mehreren AML-KI-Ressourcen werden zusätzliche Informationen zur Leistung und Datenqualität gespeichert, auf die über den Metadatenexport zugegriffen werden kann.

Weitere Informationen finden Sie unter AML-Ausgabedatenmodell.

F

Funktionsfamilie
Feature-Familien sind Sammlungen ähnlicher ML-Features, die eine einfache, für Menschen verständliche Kategorisierung bieten, um Prüfer und interne Auditteams zu informieren.

I

Unveränderliche Entität

Die AML-KI muss in der Lage sein, Datenansichten zu verschiedenen Zeitpunkten für die Optimierung, das Training und das Backtesting neu zu erstellen. Dazu unterscheidet die AML-KI zwischen veränderlichen Entitäten (deren Werte sich im Laufe der Zeit ändern können) und unveränderlichen Entitäten (die sich nicht ändern).

Ein veränderbares Element kann beispielsweise Ihr Girokontostand sein, der sich im Laufe der Zeit ändern kann. Ein unveränderliches Element kann dagegen ein Ereignis sein, z. B. ein Abheben von 50 € am 2. Juli 2024 um 12:00:00 Uhr von Ihrem Girokonto, das sich nicht ändert, da es sich um einen zeitlichen Schnappschuss handelt.

Im AML-Eingabedatenmodell haben Tabellen, die unveränderliche Entitäten darstellen, keine Felder validity_start_time und is_entity_deleted. Dazu gehört die Tabelle RiskCaseEvent.

Weitere Informationen finden Sie unter Daten im Zeitverlauf analysieren.

Weitere Informationen finden Sie unter änderbares Element.

instance

Eine Instanzressource für AML AI (auch als „Instanz“ bezeichnet) ist die Wurzel aller anderen AML AI-Ressourcen und muss erstellt werden, bevor Sie mit anderen AML AI-Ressourcen arbeiten können. Innerhalb eines Projekts können mehrere Instanzen in derselben Region erstellt werden.

Weitere Informationen finden Sie unter AML-KI-Instanz erstellen.

Untersuchungsverfahren

Ein Prüfvorgang umfasst die gesamte Prüfung oder eine Reihe von Prüfungen, die durch eine Benachrichtigung ausgelöst wurden. Der Prozess beginnt, wenn der erste Teil einer Untersuchung beginnt, und endet, wenn von dieser Untersuchung keine weiteren Ergebnisse erwartet werden.

Weitere Informationen finden Sie unter Lebenszyklus eines Risikofalls.

L

LOB
Der Geschäftsbereich (Line of Business, LOB) unterscheidet bei der AML-KI zwischen Kunden des Einzelhandels und Geschäftsbanken. Datensätze, Engine-Versionen und die Registrierung von Rechtssubjekten sind mit einer bestimmten Branche (Einzelhandel oder kommerzielle Nutzung) verknüpft.
Lookback-Window

Neben dem Kernzeitraum müssen Datasets für AML-KI-Vorgänge ein Rückschaufenster enthalten, damit Funktionen generiert werden können, die das Verhalten im Zeitverlauf verfolgen.

Weitere Informationen finden Sie unter Umfang und Dauer der Daten.

LRO

Bei mehreren AML-KI-Vorgängen, einschließlich Engine-Konfiguration, Training, Backtesting und Vorhersage, wird ein Vorgang mit langer Ausführungszeit (Long-Running Operation, LRO) gestartet.

Weitere Informationen finden Sie unter Vorgänge mit langer Ausführungszeit verwalten.

$

Fehlende Daten

Der Messwert für fehlende Werte wird für alle Featurefamilien berechnet, wenn die folgenden AML-KI-Ressourcen erstellt werden: Engine-Konfiguration, Modell, Backtestergebnisse und Vorhersageergebnisse.

Dieser Messwert gibt den Anteil der fehlenden Werte bei allen Funktionen in einer Funktionsfamilie an. Eine erhebliche Änderung der fehlenden Werte für eine beliebige Funktionsfamilie zwischen Optimierung, Training, Bewertung und Vorhersage kann auf Inkonsistenzen in den verwendeten Datensätzen hinweisen.

model

Eine Modellressource für die AML-KI (auch als „Modell“ bezeichnet) ist ein trainiertes Modell, mit dem Risikobewertungen und Erklärbarkeit generiert werden können.

Veränderliche Entität

Die AML-KI muss in der Lage sein, Datenansichten zu verschiedenen Zeitpunkten für die Optimierung, das Training und das Backtesting neu zu erstellen. Dazu unterscheidet die AML-KI zwischen veränderlichen Entitäten (deren Werte sich im Laufe der Zeit ändern können) und unveränderlichen Entitäten (die sich nicht ändern).

Ein veränderliches Element kann beispielsweise Ihr Girokontostand sein, der sich im Laufe der Zeit ändern kann. Ein unveränderliches Element kann dagegen ein Ereignis sein, z. B. ein Abheben von 50 € am 2. Juli 2024 um 12:00:00 Uhr von Ihrem Girokonto, das sich nicht ändert, da es sich um einen bestimmten Zeitpunkt handelt.

Im AML-Eingabedatenmodell haben Tabellen, die mutable Entitäten darstellen, die Felder validity_start_time und is_entity_deleted. Dazu gehören die Tabellen Person, AccountPartyLink, Transaction und PartySupplementaryData.

Weitere Informationen finden Sie unter Daten im Zeitverlauf analysieren.

Weitere Informationen finden Sie unter Unveränderliches Element.

O

Beobachtete Wiedergabe

AML AI misst die Modellleistung anhand des Messwerts „Observed Recall“ (Beobachtete Wiedererkennungsrate) anhand von Verlaufsdaten.

Dieser Messwert gibt den Anteil der positiv gekennzeichneten Parteien (z. B. Kundenabschlüsse) aus einem ausgewählten Zeitraum an, die während eines Zeitraums mit verdächtigen Aktivitäten vom bewerteten Modell als hochrisikoreich eingestuft worden wären.

P

party

Im AML-Eingabedatenmodell steht eine Partei für einen Kunden der Bank. Eine Partei kann eine natürliche Person oder eine juristische Person sein.

Weitere Informationen finden Sie in der Tabelle Party.

Siehe auch registrierte Partei.

Vorhersage

Bei der Vorhersage werden mithilfe eines Modells Risikobewertungen und Erklärbarkeiten generiert, die im AML-Prüfprozess verwendet werden können.

Vorhersageergebnisse

Eine PredictionResult-Ressource (auch als „Vorhersageergebnisse“ bezeichnet) ist das Ergebnis der Verwendung eines Modells zum Erstellen von Vorhersagen.

Weitere Informationen zum Generieren von Risikobewertungen und Erklärbarkeit sowie zur Verwendung dieser in Ihrem Analyseprozess finden Sie auf den Seiten im Abschnitt Risikobewertungen und Erklärbarkeit generieren.

R

registrierte Partei
Bevor eine Partei verwendet werden kann, um Prognoseergebnisse zu erstellen (z. B. Risikobewertungen und Erklärbarkeit auf Parteiebene), muss sie für die entsprechende Branche registriert sein.
Risikofall

Ein Risikofall umfasst einen Untersuchungsprozess oder eine Gruppe ähnlicher Untersuchungsprozesse für verschiedene Parteien.

Weitere Informationen finden Sie in der Tabelle RiskCaseEvent.

Daten zur Risikoprüfung

Daten zur Risikoprüfung werden von der AML-KI verwendet, um den Prozess und die Ergebnisse der Risikoprüfung zu verstehen und Trainingslabels zu generieren.

Risikobewertung

AML-KI-Modelle werden verwendet, um Parteien zu identifizieren, die Verhaltensweisen oder Merkmale mit hohem Risiko für Geldwäsche aufweisen. Dies geschieht anhand eines Risiko-Scores.

Risikobewertungen reichen von 0 bis 1. Je höher der Wert, desto höher ist das Risiko. Risikobewertungen sollten jedoch nicht direkt als Wahrscheinlichkeit für Geldwäscheaktivitäten interpretiert werden.

Weitere Informationen finden Sie unter Vorhersageergebnisse verstehen.

Risikotypologie

AML-KI kann das Geldwäscherisiko in fünf AML-Risikotypen im Zusammenhang mit dem Transaktionsmonitoring identifizieren.

Bei ausreichenden Untersuchungs- und ergänzenden Parteidaten (siehe Tabellen Ergänzende Daten) kann AML AI mehr Typologien abdecken.

S

Ergänzende Daten

Zusätzliche Daten sind zusätzliche Daten, die über die im AML AI-Schema enthaltenen Bereiche Kernbankdaten und Daten zur Risikoprüfung hinausgehen und für die Vorhersage des Risikos von Geldwäsche relevant sind.

Sie können beispielsweise einen Risikoindikator ermitteln und hinzufügen, der Modellen hilft, eine Risikotypologie besser vorherzusagen, die sonst nicht gut abgedeckt ist.

Mithilfe der Tabelle PartySupplementaryData können Sie einem Datensatz ergänzende Daten hinzufügen.

Zeitraum mit verdächtiger Aktivität

Ein Zeitraum mit verdächtigen Aktivitäten ist ein Zeitraum, in dem Sie der Meinung sind, dass eine untersuchte Partei verdächtiges Verhalten gezeigt hat. Dieser Wert wird bei der Modellbewertung (z. B. der Recall-Messwert für Backtest-Ergebnisse) verwendet, um zu bestätigen, dass Kunden mit hohem Risiko in Monaten erkannt werden, in denen sie verdächtige Aktivitäten hatten.

Weitere Informationen finden Sie unter Lebenszyklus eines Risikofalls.

T

Training
AML AI führt das Training im Rahmen des Erstellens eines Modells mithilfe von Hyperparametern (siehe Abstimmung) aus einer bestimmten Engine-Konfiguration durch.
Tuning
Die Abstimmung ist die Optimierung der Modellhyperparameter. Die AML-KI führt die Optimierung im Rahmen der Erstellung einer Engine-Konfiguration durch.

V

validity start time

Der Beginn der Gültigkeit für ein veränderbares Rechtssubjekt wird von der AML-KI verwendet, um eine Ansicht dessen zu erstellen, was der Bank zu einem bestimmten Zeitpunkt bekannt war. So können AML-KI-Modelle genau trainiert werden, um sie für die neuesten Daten (d. h. die der Bank bekannten Daten) wiederverwenden und so hochpräzise Risikobewertungen erstellen zu können.

Die Gültigkeitsstartzeit für eine bestimmte Zeile ist der früheste Zeitpunkt, zu dem die Daten in dieser Zeile der Bank bekannt und korrekt waren.

Weitere Informationen finden Sie unter Daten im Zeitverlauf analysieren.