Übersicht
Auf dieser Seite erhalten Sie einen Überblick über die AML-KI-Prozesse und wichtige Konzepte für Kunden. Sie richtet sich in erster Linie an Teams, die AML-KI zum Trainieren, Testen und Bereitstellen von Modellen verwenden.
Mit AML AI können Banken Modelle zur Erkennung von Geldwäsche automatisch trainieren, testen und bereitstellen. Die AML-KI-Leitfäden sind in fünf Abschnitte auf der linken Seite unterteilt, die den folgenden fünf Schritten entsprechen.
Schritt | Beschreibung |
---|---|
1. AML AI einrichten | Prüfen Sie, ob Ihr Google Cloud-Projekt für die Verwendung von AML-KI bereit ist. Aktivieren Sie die erforderlichen Google Cloud-Dienste und richten Sie Protokollierung und Kontingente ein. Erstellen Sie eine oder mehrere AML-KI-Instanzen. |
2. Daten für AML AI vorbereiten | Sehen Sie sich das Datenmodell und das Schema an. Legen Sie fest, welche Daten eingeschlossen werden sollen. Erfassen und transformieren Sie die erforderlichen Kernbankdaten, Daten zur Risikoprüfung und alle anderen erforderlichen Daten. Dataset erstellen und validieren |
3. Modell generieren und Leistung bewerten | Informationen zu AML-KI-Engines, -Modellen und Backtests
|
4. Risikobewertungen und Erklärbarkeit generieren | Registrieren Sie Ihre Kunden aus dem Einzelhandel und aus dem Firmenkundengeschäft. Verwenden Sie ein Modell, um Risikobewertungen und Erläuterungen für Folgendes zu generieren:
|
5. Vorbereitung auf die Modell- und Risikogovernance | Kombinieren Sie AML-KI-Ergebnisse aus Tuning, Training, Bewertung und Vorhersage mit AML-Konzept- und Produktdokumentation, um die Anforderungen Ihres Modellrisikomanagementprozesses zu erfüllen. |
Die wichtigsten technischen AML-KI-Vorgänge zum Erstellen, Testen und Bereitstellen von Modellen sind: Diese unterstützen die Schritte 2 bis 4 in der vorherigen Tabelle.
- AML AI-Dataset erstellen: Hiermit wird ein strukturierter Satz von BigQuery-Eingabedatentabellen für AML AI erstellt.
- Engine-Konfiguration: Mit dieser Option wird eine AML AI-Engine an ein AML AI-Dataset angepasst, einschließlich der Hyperparameter-Abstimmung.
- Modelltraining: Ein AML-KI-Modell wird mit einer Enginekonfiguration und einem Datensatz trainiert.
- Backtest: Ein AML-KI-Modell wird anhand von Verlaufsdaten in einem Datensatz getestet und die Leistung zusammengefasst.
- Register Parties: Registriert Parteien (Kunden der Bank, die Bankprodukte haben und Transaktionen senden oder empfangen), damit sie bei der Vorhersage bewertet werden können.
- Vorhersage: Erstellt Bewertungen für Parteien und Erläuterungen für die Verwendung in der Produktion.
Für die Engine-Konfiguration, das Modelltraining, den Modell-Backtest und die Modellvorhersage ist jeweils ein AML-KI-Dataset als Eingabe erforderlich. Es werden entsprechende Artefakte zurückgegeben, die in anderen Vorgängen verwendet werden. Modelltraining gibt beispielsweise eine Referenz auf ein trainiertes AML-KI-Modell zurück, das für Backtests oder Vorhersagen verwendet werden kann. Technische Details zu den Vorgängen finden Sie in der REST-Referenzübersicht.
Abhängigkeitsstruktur für AML AI-Prozesse
Wichtige Aspekte bei der Verwendung von KI für die Geldwäscheprävention
In diesem Abschnitt erhalten Kunden eine Einführung in die wichtigsten Konzepte der KI für die Geldwäscheprävention und einige Best Practices. Die hier behandelten Themen werden in speziellen Leitfäden ausführlicher behandelt. Außerdem finden Sie Links zu weiterführenden Informationen.
Datumskonsistenz
Die AML-KI verwendet für verschiedene Vorgänge unterschiedliche Zeiträume. Die für die einzelnen Vorgänge ausgewählten Zeiträume sollten sorgfältig ausgewählt werden, um zuverlässige Ergebnisse zu erzielen. Um Verzerrungen bei den Ergebnissen zu vermeiden, ist es wichtig, dass sich die Monate, die für das Training eines AML-KI-Modells verwendet werden, nicht mit den Monaten überschneiden, die für das Backtesting verwendet werden.
Da ein AML-KI-Dataset Daten aus vielen Monaten enthält, können Datasets bei korrekter Datumsauswahl für mehrere Vorgänge verwendet werden. Das folgende Diagramm zeigt einen Entwicklungszyklus mit AML-KI, bei dem verschiedene Zeiträume innerhalb eines einzelnen Datasets über einen Zeitraum von 42 Monaten verwendet werden, um eine Engine zu konfigurieren (Hyperparameter-Abstimmung), zu trainieren und zu Backtesten. Bei all diesen Prozessen werden Lookback-Windows verwendet, die dem Modell Kontext bieten und sich problemlos mit Daten überschneiden können, die für andere Vorgänge verwendet werden.
Weitere Informationen zu AML-KI-Datensätzen und Zeitfenstern für verschiedene Vorgänge finden Sie unter Datenumfang und -dauer.
Wie Sie Änderungen an Ihren Daten im Zeitverlauf korrekt erfassen, erfahren Sie unter Datenänderungen im Zeitverlauf.
Häufigkeit der Produktionsbatches
Bei der Vorhersage generiert die AML-KI AML-Risikobewertungen auf Basis eines Kalendermonats. Kunden verwenden AML-KI häufig als Teil eines monatlichen Batch-Prozesses. Es wird empfohlen, Vorhersagen nach Möglichkeit für Monate mit vollständigen Transaktionsdaten auszuführen.
Feldkonsistenz
Wie bei jedem Prozess des maschinellen Lernens sollten die Daten zwischen Trainings- und Testdaten möglichst konsistent sein. Wenn Felder nicht einheitlich ausgefüllt sind, können die Änderungen zu unzuverlässigen Ergebnissen führen. Es wird dringend empfohlen, Maßnahmen zu ergreifen, damit die Felder für jeden Vorgang in einem Entwicklungszyklus einheitlich ausgefüllt werden. Dies gilt insbesondere, wenn für jeden Vorgang unterschiedliche Datensätze verwendet werden. Weitere Informationen finden Sie unter Dataset-Konsistenz.
Engine-Konfigurationen
Nachdem eine Engine-Konfiguration erstellt wurde, ist es normalerweise nicht erforderlich, sie für jeden neuen Datensatz oder in jedem Entwicklungszyklus neu zu erstellen. Die in einer Engine-Konfiguration für einen Datensatz ausgewählten Hyperparameter eignen sich in der Regel auch für ähnliche Datensätze.
Im folgenden Diagramm sind iterative Entwicklungszyklen dargestellt. Im vorherigen Diagramm wird dagegen ein einzelnes Dataset sowohl für das Modelltraining als auch für Backtests verwendet.
Weitere Informationen finden Sie unter Wann Sie ein Modell optimieren oder übernehmen sollten.
Data Lineage
Die meisten Richtlinien zur Modellverwaltung definieren die Anforderung, die Datenabfolge zu erfassen, die bei allen ML-Vorgängen verwendet wird, von der Enginekonfiguration über das Training, die Bewertung bis hin zur Vorhersage. Kunden sind dafür verantwortlich, diese Datenabfolge zu verfolgen.
Wir empfehlen, in den Namen aller Eingabedaten, AML-KI-Ressourcen und Ausgabedaten eine eindeutige Kennung zu verwenden, um die Herkunft über alle Phasen hinweg zu verfolgen. So wird eine starke Verknüpfung zwischen den Ressourcen in einem bestimmten Lauf gewährleistet. Kunden können auch alle AML-KI-Ressourcen kennzeichnen, um die Anforderungen an die Herkunft zu erfüllen.
Außerdem empfehlen wir, BigQuery-Snapshots in API-Anfragen zu verwenden, um eine korrekte Datenabfolge zu gewährleisten.
Diese Konfiguration hilft bei der Beantwortung von Fragen wie „Woher stammt diese Engine-Konfiguration?“ und „Woher stammt dieses Modell?“ und unterstützt Sie bei der Untersuchung und Behebung von Vorfällen.
Weitere Informationen zum Erstellen und Verwalten von AML-KI-Ressourcen finden Sie auf den Seiten zur REST API.