In diesem Glossar werden Begriffe definiert, die speziell für KI in der Geldwäscheprävention gelten. Allgemeine Begriffe zum Thema maschinelles Lernen finden Sie im Glossar zum maschinellen Lernen.
A
- ADC
Jede der API-Clientbibliotheken bietet die Möglichkeit, lokale Standardanmeldedaten für Anwendungen (Application Default Credentials, ADC) zu verwenden.
Informationen zum Unterschied zwischen Ihren lokalen ADC-Anmeldedaten und Ihren gcloud CLI-Anmeldedaten finden Sie unter Anmeldedaten für die gcloud CLI und ADC.
B
- backtesting
- Beim Backtesting werden Verlaufsdaten verwendet, um die Leistung (beobachtete Trefferquote) eines Modells zu bewerten. Dazu wird der generierte Risikowert mit den tatsächlichen Ergebnissen früherer Tests verglichen.
- Backtest-Ergebnisse
- Eine AML-KI-BacktestResult-Ressource (auch als „Backtest-Ergebnisse“ bezeichnet) wird erstellt, um die Leistung eines Modells anhand eines Datasets zu testen.
- Weitere Informationen finden Sie unter Modell bewerten.
C
- Kernbankdaten
- Kernbankendaten umfassen Daten zu Parteien, Transaktionen und Kontobeständen. So kann die AML-KI Ihre Kunden und ihre Bankaktivitäten besser verstehen, um riskante Merkmale und Verhaltensweisen zu erkennen.
- Kernzeitfenster
Das Kernzeitfenster bezieht sich auf den Zeitraum, der bei einer AML-KI-Operation (Enginekonfiguration, Training, Backtesting und Vorhersage) zum Generieren von Trainings-, Bewertungsbeispielen oder Modellergebnissen verwendet wird. Dieser Zeitraum muss von allen Tabellen im Dataset abgedeckt sein.
Für verschiedene API-Vorgänge gelten unterschiedliche Anforderungen an das Kernzeitfenster für die Generierung von Funktionen und Labels. Weitere Informationen finden Sie unter Umfang und Dauer der Daten.
Weitere Informationen finden Sie unter Lookback-Window.
D
- Datenvalidierung
- AML AI führt Datenvalidierungsüberprüfungen beim Erstellen eines Datensatzes, einer Engine-Konfiguration, eines Modells, von Backtestergebnissen oder Vorhersageergebnissen durch. Wenn der angegebene Datensatz die Datenvalidierung nicht besteht, wird die Ressource nicht erstellt und es werden Datenvalidierungsfehler ausgegeben, die die Art des Problems angeben.
- Weitere Informationen finden Sie unter Fehler bei der Datenvalidierung.
- Dataset
Mit einer Dataset-Ressource für AML-KI (oder einfach „Dataset“) werden Daten gemäß dem AML-Eingabedatenmodell angegeben, die zum Generieren eines Modells, zum Bewerten der Leistung eines Modells und zum Generieren von Risikobewertungen und Erklärbarkeit pro Partei verwendet werden können.
Weitere Informationen finden Sie unter AML-Datenmodell und -Anforderungen.
E
- Endzeit
Bei AML-KI-Vorgängen, bei denen ein Datensatz verwendet wird, müssen Sie ein Enddatum angeben. In diesem Feld wird festgelegt, welche Monate im Datensatz zum Generieren von Trainings- oder Bewertungsbeispielen und Modellergebnissen verwendet werden.
Die Endzeit und alle für einen Vorgang verwendeten Monate müssen in den Zeitraum des zugehörigen Datensatzes fallen.
Für einen Trainingsvorgang ist beispielsweise ein Hauptzeitraum von 15 Monaten erforderlich. Wenn Sie ein Dataset mit dem Zeitraum 15. Oktober 2021 bis 21. Mai 2023 und dem Enddatum 12. April 2023 verwenden, werden für das Training Beispiele aus den Kalendermonaten Januar 2022 bis März 2023 verwendet, die in den Zeitraum des Datasets fallen.
- engine config
Eine EngineConfig-Ressource für AML-KI (auch als „Engine-Konfiguration“ bezeichnet) gibt Parameter für die Generierung und Bewertung eines AML-KI-Modells sowie für die Generierung von Risikobewertungen und Erklärbarkeit an.
Einige dieser Parameter werden im API-Aufruf angegeben, um eine Engine-Konfiguration zu erstellen, z. B. die Engine-Version und das erwartete Untersuchungsvolumen. Andere Parameter werden automatisch von AML AI anhand eines angegebenen Datasets generiert, z. B. abgestimmte Hyperparameter.
Weitere Informationen finden Sie unter Einen Engine konfigurieren.
- Engine-Version
Mit einer EngineVersion-Ressource (auch als „Engine-Version“ bezeichnet) für die AML-KI werden Aspekte der Risikoerkennung durch die AML-KI definiert. Dazu gehören die Modelloptimierung, das Training und die Bewertung sowie das gesamte AML-Datenmodell und die Featurefamilien.
Wenn Sie eine AML-KI-Engine konfigurieren, müssen Sie eine zu verwendende Engine-Version angeben. Die Engine-Version wird dann verwendet, um Modelle mit dieser Engine-Konfiguration zu trainieren und zu bewerten sowie Risikobewertungen und Erklärbarkeit zu generieren.
Die Benennung der Engine-Version ist folgendermaßen strukturiert: Der Engine-Typ gibt die unterstützte Branche an. Engine-Subtyp, Tuning, Hauptversion und Nebenversion werden aktualisiert, wenn neue Verhaltensweisen implementiert werden.
Beispiele für Versionen:
aml-retail.default.v004.000.202312-000
aml-commercial.default.v004.000.202312-000
Weitere Informationen zum Verwalten von Engine-Versionen finden Sie unter Engine-Versionen verwalten.
- Bewertung
Siehe auch backtesting.
- Erklärbarkeit
AML-KI-Modelle werden verwendet, um Parteien zu identifizieren, die Verhaltensweisen oder Merkmale mit hohem Risiko für Geldwäsche aufweisen. Die Erklärbarkeit gibt an, welche Verhaltensweisen oder Merkmale am stärksten zu einem hohen Risikowert für eine bestimmte Partei beigetragen haben.
Weitere Informationen finden Sie unter Vorhersageergebnisse verstehen.
Siehe auch Vorhersage.
- Metadaten exportieren
In mehreren AML-KI-Ressourcen werden zusätzliche Informationen zur Leistung und Datenqualität gespeichert, auf die über den Metadatenexport zugegriffen werden kann.
Weitere Informationen finden Sie unter AML-Ausgabedatenmodell.
F
- Funktionsfamilie
- Feature-Familien sind Sammlungen ähnlicher ML-Features, die eine einfache, für Menschen verständliche Kategorisierung bieten, um Prüfer und interne Auditteams zu informieren.
I
- Unveränderliche Entität
Die AML-KI muss in der Lage sein, Datenansichten zu verschiedenen Zeitpunkten für die Optimierung, das Training und das Backtesting neu zu erstellen. Dazu unterscheidet die AML-KI zwischen veränderlichen Entitäten (deren Werte sich im Laufe der Zeit ändern können) und unveränderlichen Entitäten (die sich nicht ändern).
Ein veränderbares Element kann beispielsweise Ihr Girokontostand sein, der sich im Laufe der Zeit ändern kann. Ein unveränderliches Element kann dagegen ein Ereignis sein, z. B. ein Abheben von 50 € am 2. Juli 2024 um 12:00:00 Uhr von Ihrem Girokonto, das sich nicht ändert, da es sich um einen zeitlichen Schnappschuss handelt.
Im AML-Eingabedatenmodell haben Tabellen, die unveränderliche Entitäten darstellen, keine Felder
validity_start_time
undis_entity_deleted
. Dazu gehört die Tabelle RiskCaseEvent.Weitere Informationen finden Sie unter Daten im Zeitverlauf analysieren.
Weitere Informationen finden Sie unter änderbares Element.
- instance
Eine Instanzressource für AML AI (auch als „Instanz“ bezeichnet) ist die Wurzel aller anderen AML AI-Ressourcen und muss erstellt werden, bevor Sie mit anderen AML AI-Ressourcen arbeiten können. Innerhalb eines Projekts können mehrere Instanzen in derselben Region erstellt werden.
Weitere Informationen finden Sie unter AML-KI-Instanz erstellen.
- Untersuchungsverfahren
Ein Prüfvorgang umfasst die gesamte Prüfung oder eine Reihe von Prüfungen, die durch eine Benachrichtigung ausgelöst wurden. Der Prozess beginnt, wenn der erste Teil einer Untersuchung beginnt, und endet, wenn von dieser Untersuchung keine weiteren Ergebnisse erwartet werden.
Weitere Informationen finden Sie unter Lebenszyklus eines Risikofalls.
L
- LOB
- Der Geschäftsbereich (Line of Business, LOB) unterscheidet bei der AML-KI zwischen Kunden des Einzelhandels und Geschäftsbanken. Datensätze, Engine-Versionen und die Registrierung von Rechtssubjekten sind mit einer bestimmten Branche (Einzelhandel oder kommerzielle Nutzung) verknüpft.
- Lookback-Window
Neben dem Kernzeitraum müssen Datasets für AML-KI-Vorgänge ein Rückschaufenster enthalten, damit Funktionen generiert werden können, die das Verhalten im Zeitverlauf verfolgen.
Weitere Informationen finden Sie unter Umfang und Dauer der Daten.
- LRO
Bei mehreren AML-KI-Vorgängen, einschließlich Engine-Konfiguration, Training, Backtesting und Vorhersage, wird ein Vorgang mit langer Ausführungszeit (Long-Running Operation, LRO) gestartet.
Weitere Informationen finden Sie unter Vorgänge mit langer Ausführungszeit verwalten.
$
- Fehlende Daten
Der Messwert für fehlende Werte wird für alle Featurefamilien berechnet, wenn die folgenden AML-KI-Ressourcen erstellt werden: Engine-Konfiguration, Modell, Backtestergebnisse und Vorhersageergebnisse.
Dieser Messwert gibt den Anteil der fehlenden Werte bei allen Funktionen in einer Funktionsfamilie an. Eine erhebliche Änderung der fehlenden Werte für eine beliebige Funktionsfamilie zwischen Optimierung, Training, Bewertung und Vorhersage kann auf Inkonsistenzen in den verwendeten Datensätzen hinweisen.
- model
Eine Modellressource für die AML-KI (auch als „Modell“ bezeichnet) ist ein trainiertes Modell, mit dem Risikobewertungen und Erklärbarkeit generiert werden können.
- Veränderliche Entität
Die AML-KI muss in der Lage sein, Datenansichten zu verschiedenen Zeitpunkten für die Optimierung, das Training und das Backtesting neu zu erstellen. Dazu unterscheidet die AML-KI zwischen veränderlichen Entitäten (deren Werte sich im Laufe der Zeit ändern können) und unveränderlichen Entitäten (die sich nicht ändern).
Ein veränderliches Element kann beispielsweise Ihr Girokontostand sein, der sich im Laufe der Zeit ändern kann. Ein unveränderliches Element kann dagegen ein Ereignis sein, z. B. ein Abheben von 50 € am 2. Juli 2024 um 12:00:00 Uhr von Ihrem Girokonto, das sich nicht ändert, da es sich um einen bestimmten Zeitpunkt handelt.
Im AML-Eingabedatenmodell haben Tabellen, die mutable Entitäten darstellen, die Felder
validity_start_time
undis_entity_deleted
. Dazu gehören die Tabellen Person, AccountPartyLink, Transaction und PartySupplementaryData.Weitere Informationen finden Sie unter Daten im Zeitverlauf analysieren.
Weitere Informationen finden Sie unter Unveränderliches Element.
O
- Beobachtete Wiedergabe
AML AI misst die Modellleistung anhand des Messwerts „Observed Recall“ (Beobachtete Wiedererkennungsrate) anhand von Verlaufsdaten.
Dieser Messwert gibt den Anteil der positiv gekennzeichneten Parteien (z. B. Kundenabschlüsse) aus einem ausgewählten Zeitraum an, die während eines Zeitraums mit verdächtigen Aktivitäten vom bewerteten Modell als hochrisikoreich eingestuft worden wären.
P
- party
Im AML-Eingabedatenmodell steht eine Partei für einen Kunden der Bank. Eine Partei kann eine natürliche Person oder eine juristische Person sein.
Weitere Informationen finden Sie in der Tabelle Party.
Siehe auch registrierte Partei.
- Vorhersage
Bei der Vorhersage werden mithilfe eines Modells Risikobewertungen und Erklärbarkeiten generiert, die im AML-Prüfprozess verwendet werden können.
- Vorhersageergebnisse
Eine PredictionResult-Ressource (auch als „Vorhersageergebnisse“ bezeichnet) ist das Ergebnis der Verwendung eines Modells zum Erstellen von Vorhersagen.
Weitere Informationen zum Generieren von Risikobewertungen und Erklärbarkeit sowie zur Verwendung dieser in Ihrem Analyseprozess finden Sie auf den Seiten im Abschnitt Risikobewertungen und Erklärbarkeit generieren.
R
- registrierte Partei
- Bevor eine Partei verwendet werden kann, um Prognoseergebnisse zu erstellen (z. B. Risikobewertungen und Erklärbarkeit auf Parteiebene), muss sie für die entsprechende Branche registriert sein.
- Risikofall
Ein Risikofall umfasst einen Untersuchungsprozess oder eine Gruppe ähnlicher Untersuchungsprozesse für verschiedene Parteien.
Weitere Informationen finden Sie in der Tabelle RiskCaseEvent.
- Daten zur Risikoprüfung
Daten zur Risikoprüfung werden von der AML-KI verwendet, um den Prozess und die Ergebnisse der Risikoprüfung zu verstehen und Trainingslabels zu generieren.
- Risikobewertung
AML-KI-Modelle werden verwendet, um Parteien zu identifizieren, die Verhaltensweisen oder Merkmale mit hohem Risiko für Geldwäsche aufweisen. Dies geschieht anhand eines Risiko-Scores.
Risikobewertungen reichen von 0 bis 1. Je höher der Wert, desto höher ist das Risiko. Risikobewertungen sollten jedoch nicht direkt als Wahrscheinlichkeit für Geldwäscheaktivitäten interpretiert werden.
Weitere Informationen finden Sie unter Vorhersageergebnisse verstehen.
- Risikotypologie
AML-KI kann das Geldwäscherisiko in fünf AML-Risikotypen im Zusammenhang mit dem Transaktionsmonitoring identifizieren.
Bei ausreichenden Untersuchungs- und ergänzenden Parteidaten (siehe Tabellen Ergänzende Daten) kann AML AI mehr Typologien abdecken.
S
- Ergänzende Daten
Zusätzliche Daten sind zusätzliche Daten, die über die im AML AI-Schema enthaltenen Bereiche Kernbankdaten und Daten zur Risikoprüfung hinausgehen und für die Vorhersage des Risikos von Geldwäsche relevant sind.
Sie können beispielsweise einen Risikoindikator ermitteln und hinzufügen, der Modellen hilft, eine Risikotypologie besser vorherzusagen, die sonst nicht gut abgedeckt ist.
Mithilfe der Tabelle PartySupplementaryData können Sie einem Datensatz ergänzende Daten hinzufügen.
- Zeitraum mit verdächtiger Aktivität
Ein Zeitraum mit verdächtigen Aktivitäten ist ein Zeitraum, in dem Sie der Meinung sind, dass eine untersuchte Partei verdächtiges Verhalten gezeigt hat. Dieser Wert wird bei der Modellbewertung (z. B. der Recall-Messwert für Backtest-Ergebnisse) verwendet, um zu bestätigen, dass Kunden mit hohem Risiko in Monaten erkannt werden, in denen sie verdächtige Aktivitäten hatten.
Weitere Informationen finden Sie unter Lebenszyklus eines Risikofalls.
T
- Training
- AML AI führt das Training im Rahmen des Erstellens eines Modells mithilfe von Hyperparametern (siehe Abstimmung) aus einer bestimmten Engine-Konfiguration durch.
- Tuning
- Die Abstimmung ist die Optimierung der Modellhyperparameter. Die AML-KI führt die Optimierung im Rahmen der Erstellung einer Engine-Konfiguration durch.
V
- validity start time
Der Beginn der Gültigkeit für ein veränderbares Rechtssubjekt wird von der AML-KI verwendet, um eine Ansicht dessen zu erstellen, was der Bank zu einem bestimmten Zeitpunkt bekannt war. So können AML-KI-Modelle genau trainiert werden, um sie für die neuesten Daten (d. h. die der Bank bekannten Daten) wiederverwenden und so hochpräzise Risikobewertungen erstellen zu können.
Die Gültigkeitsstartzeit für eine bestimmte Zeile ist der früheste Zeitpunkt, zu dem die Daten in dieser Zeile der Bank bekannt und korrekt waren.
Weitere Informationen finden Sie unter Daten im Zeitverlauf analysieren.