Übersicht
Auf dieser Seite erhalten Sie einen Überblick über die AML-KI-Prozesse und wichtige Konzepte für Kunden. Sie richtet sich in erster Linie an Teams, die AML-KI zum Trainieren, Testen und Bereitstellen von Modellen verwenden.
Mit AML AI können Banken Modelle zur Erkennung von Geldwäsche automatisch trainieren, testen und bereitstellen. Die AML AI-Leitfäden sind die in fünf Abschnitte auf der linken Navigationsleiste unterteilt sind, die den folgenden fünf Schritte.
Schritt | Beschreibung |
---|---|
1. AML AI einrichten | Sorgen Sie dafür, dass Ihr Google Cloud-Projekt für die Verwendung von AML AI bereit ist. Aktivieren Sie die erforderlichen Google Cloud-Dienste und richten Sie Logging und Kontingente ein. Erstellen Sie eine oder mehrere AML-KI-Instanzen. |
2. Daten für AML AI vorbereiten | Prüfen Sie das Datenmodell und das Schema. Priorisieren Sie die einzubeziehenden Daten. Erforderliche zentrale Bankdaten erfassen und transformieren, Risikountersuchung Daten und andere Daten, die Sie benötigen. Dataset erstellen und validieren |
3. Modell generieren und Leistung bewerten | Informationen zu AML AI-Engines, -Modellen und Backtests
|
4. Risikobewertungen und Erklärbarkeit generieren | Registrieren Sie Ihre Kunden aus dem Einzelhandel und aus dem Firmenkundengeschäft. Verwenden Sie ein Modell, um
Risikobewertungen und Erklärbarkeit nach einzelnen Parteien generieren für:
|
5. Vorbereitung auf die Modell- und Risikogovernance | Kombinieren Sie AML AI-Ausgaben aus Abstimmung, Training Bewertung und Vorhersage mit dem AML-Konzept und der Produktdokumentation, die Anforderungen Ihres Risiko-Governance-Prozesses für Modelle erfüllen. |
Die wichtigsten technischen AML-KI-Vorgänge zum Erstellen, Testen und Bereitstellen von Modellen sind: Diese unterstützen die Schritte 2 bis 4 in der vorherigen Tabelle.
- AML AI-Dataset erstellen: Hiermit wird ein strukturierter Satz von BigQuery-Eingabedatentabellen für AML AI erstellt.
- Engine-Konfiguration: Mit dieser Option wird eine AML AI-Engine an ein AML AI-Dataset angepasst, einschließlich der Hyperparameter-Abstimmung.
- Modelltraining: Trainiert ein AML-KI-Modell mit einer Engine Konfiguration und Dataset
- Backtest: Ein AML-KI-Modell wird anhand von Verlaufsdaten in einem Datensatz getestet und die Leistung zusammengefasst.
- Registrierungsparteien: Hier werden Parteien registriert (Kunden der Bank, die und Transaktionen senden oder empfangen), damit diese in Vervollständigung
- Vorhersage: Erstellt Bewertungen für Parteien und Erläuterungen für die Verwendung in der Produktion.
Für die Engine-Konfiguration, das Modelltraining, den Modell-Backtest und die Modellvorhersage ist jeweils ein AML-KI-Dataset als Eingabe erforderlich. Sie geben entsprechende Artefakte zurück, die in anderen Vorgängen verwendet werden. Beispiel: Modelltraining gibt einen Verweis auf ein trainiertes AML-KI-Modell zurück, das verwendet werden kann für Backtest oder Vorhersage. Technische Details zu den Vorgängen finden Sie in der REST-Referenzübersicht
Abhängigkeitsstruktur für AML AI-Prozesse
Wichtige Aspekte bei der Verwendung von KI für die Geldwäscheprävention
Dieser Abschnitt soll der Kundschaft eine Einführung in die wichtigsten Konzepte geben. von AML AI und geben einige Best Practices an. Die hier behandelten Themen werden in speziellen Leitfäden ausführlicher behandelt. Außerdem finden Sie Links zu weiterführenden Informationen.
Konsistenz von Datumsangaben
AML AI verwendet unterschiedliche Zeiträume für verschiedene Vorgänge. Wählen Sie für jeden Vorgang die ausgewählten Termine aus, damit zuverlässige Ergebnisse zu liefern. Um Verzerrungen in den Ergebnissen zu vermeiden, ist es insbesondere wichtig, Die Monate, die für das Training eines AML-KI-Modells verwendet werden, überschneiden sich nicht mit die Monate, die für das Backtesting verwendet wurden.
Da ein AML-KI-Dataset Daten aus vielen Monaten enthält, können Datasets bei korrekter Datumsauswahl für mehrere Vorgänge verwendet werden. Das folgende Diagramm zeigt einen Entwicklungszyklus mit AML-KI, bei dem verschiedene Zeiträume innerhalb eines einzelnen Datasets über einen Zeitraum von 42 Monaten verwendet werden, um eine Engine zu konfigurieren (Hyperparameter-Abstimmung), zu trainieren und zu Backtesten. Alle Diese Prozesse nutzen Lookback-Windows, die Kontext für das Modell liefern sich sicher mit Daten überschneiden, die für andere Vorgänge verwendet werden.
Weitere Informationen zu AML AI-Datasets und Zeitfenstern für verschiedene finden Sie unter Umfang und Dauer von Daten.
Wie Sie Änderungen an Ihren Daten im Zeitverlauf korrekt erfassen, erfahren Sie unter Datenänderungen im Zeitverlauf.
Produktions-Batchhäufigkeit
Für die Vorhersage generiert AML AI AML-Risikobewertungen auf Kalendermonatbasis. Kunden verwenden AML-KI häufig als Teil eines monatlichen Batch-Prozesses. Es wird empfohlen, Vorhersagen nach Möglichkeit für Monate mit vollständigen Transaktionsdaten auszuführen.
Feldkonsistenz
Wie bei jedem Prozess des maschinellen Lernens sollten die Daten so einheitlich wie möglich sein. zwischen Trainingsdaten und Testdaten. Wenn Felder nicht einheitlich ausgefüllt sind, können die Änderungen zu unzuverlässigen Ergebnissen führen. Es wird dringend empfohlen, so wird sichergestellt, dass die Felder für jeden Vorgang in einem Entwicklungszyklus – und das gilt besonders, wenn verschiedene Datasets verwendet werden. für jeden Vorgang. Weitere Informationen finden Sie unter Dataset-Konsistenz.
Engine-Konfigurationen
Nachdem eine Engine-Konfiguration erstellt wurde, ist es normalerweise nicht erforderlich, für jedes neue Dataset oder in jedem Entwicklungszyklus. Die in einer Engine-Konfiguration für einen Datensatz ausgewählten Hyperparameter funktionieren in der Regel auch gut mit ähnlichen Datensätzen.
Im folgenden Diagramm sind iterative Entwicklungszyklen dargestellt. Im vorherigen Diagramm wird dagegen ein einzelnes Dataset sowohl für das Modelltraining als auch für Backtests verwendet.
Weitere Informationen finden Sie unter Wann Sie ein Design anpassen oder übernehmen sollten.
Data Lineage
Die meisten Richtlinien zur Modellverwaltung definieren die Anforderung, die Datenabfolge zu erfassen, die bei allen ML-Vorgängen verwendet wird, von der Enginekonfiguration über das Training, die Bewertung bis hin zur Vorhersage. Die Kundschaft ist für das Tracking dieser Datenherkunft verantwortlich.
Wir empfehlen, in den Namen aller Eingabedaten, AML-KI-Ressourcen und Ausgabedaten eine eindeutige Kennung zu verwenden, um die Herkunft über alle Phasen hinweg zu verfolgen. Dies gewährleistet eine starke Verknüpfung zwischen Ressourcen bei einer bestimmten Ausführung. Kunden können auch alle AML-KI-Ressourcen kennzeichnen, um die Anforderungen an die Herkunft zu erfüllen.
Außerdem empfehlen wir, BigQuery-Snapshots in API-Anfragen zu verwenden, für eine genaue Datenherkunft.
Diese Konfiguration hilft bei der Beantwortung von Fragen wie „Woher stammt diese Engine-Konfiguration?“ und „Woher stammt dieses Modell?“ und unterstützt Sie bei der Untersuchung und Behebung von Vorfällen.
Weitere Informationen zum Erstellen und Verwalten von AML-KI-Ressourcen finden Sie auf den Seiten zur REST API.