Umfang und Dauer der Daten

Mit AML AI wird das Risiko von Geldwäsche für ein Unternehmen Geschäftsbereich. Ein Geschäftsbereich ist mit einem Ihrer Einzelhandels- oder kommerzielle Kundschaft nutzen.

Wenn Sie ein Dataset zur Verwendung mit einem Geschäftsbereich erstellen, müssen Sie mehrere Tabellen. Jede Tabelle sollte einen ausreichenden Zeitraum abdecken. Auf dieser Seite finden Sie einen Überblick über die benötigten Tabellen und erfahren, wie Sie den Zeitraum für jede Tabelle festlegen.

Zu verwendende Tabellen

Das BigQuery-Dataset, das mit AML AI verwendet wird, sollte die folgenden Tabellen enthalten:

  • Partei: Alle Parteien, die für diese Geschäftsstelle relevant sind
    • Retail LoB: Alle Privatkunden, die im angegebenen Zeitraum Konten hatten
    • Kommerzielle Kundensegmente: Alle Kunden des kommerziellen Bankgeschäfts (Rechtssubjekte und natürliche Personen), die in dem erforderlichen Zeitraum Konten hatten
  • AccountPartyLink: Im vollständigen Verlauf sehen Sie, welche Konten die von welchen Parteien getragen werden. Dies sollte alle Konten für Produkte und wenn eine der Parteien in der Tabelle "Party" der primäre Kontoinhaber bei einen beliebigen Zeitpunkt im erforderlichen Zeitraum.
  • Transaktion: Alle Transaktionen für Konten im AccountPartyLink-Tabelle für den erforderlichen Zeitraum.
  • RiskCaseEvent: Alle Risikofallereignisse (siehe Ereignistyp) für jeden Risikofall und eine Partei in der Tabelle "Party" mit einem AML_PROCESS_START (Beginn der Prüfung) im erforderlichen Zeitraum. Diese Tabelle kann Ereignisse enthalten, deren Ereigniszeit vor oder nach dem erforderlichen Zeitraum liegt.
  • PartySupplementaryData (falls verwendet): 0 bis 100 einzelne Nutzer Party_supplementary_data_id-Werten einen vollständigen Verlauf der Werte von diese Felder für alle Parteien in der Tabelle "Party" für den erforderlichen Zeitraum.

Zusätzliche Daten verwenden

Weitere Informationen finden Sie unter Ergänzende Daten, wenn Sie zusätzliche Daten zu den Parteien haben (die im Schema nicht anderweitig abgedeckt sind), die für die Identifizierung des Risikos von Geldwäsche relevant sind.

Zeitraum des Datasets

Der Zeitraum, den jede Tabelle in einem Dataset abdecken sollte, kann als für jede Operation folgt. Sie benötigen folgende Informationen:

  • Die Endzeit. Dies ist der letzte Zeitpunkt, ab dem Labels verwendet und Daten zum Generieren von Abstimmungsfunktionen verwendet werden.
  • Die von Ihnen verwendete Engine-Version (siehe Liste der Engine-Versionen).
  • Die Operation, die Sie durchführen werden: Abstimmung, Trainieren, Vorhersage oder Backtest.
  • Bei Vorhersage- oder Backtest-Vorgängen muss im API-Aufruf die Anzahl der Zeiträume angegeben werden, für die der Vorgang ausgeführt werden soll.

Dauer des Datenumfangs

Bestimmen Sie zuerst die Anzahl der Zeiträume, die für den Vorgang verwendet werden. Das ist die Anzahl der aufeinanderfolgenden Monate, die mit dem letzten vollen Kalendermonat vor dem angegebenen Endzeitpunkt enden und für die die AML-KI die Modellfunktionen bewertet.

  • Bei Vorhersage- und Backtestvorgängen ist dies die Anzahl der Vorhersagen Zeiträume oder Backtest-Zeiträume, die im API-Aufruf angegeben sind.
  • Bei anderen Vorgängen hängt dies von der Engine-Version und dem Vorgang ab. Bei der Engine-Version v004.004 werden beispielsweise 18 Perioden für die Optimierung und 15 für das Training verwendet.

Als Nächstes sollten Sie das Lookback-Window für jede Tabelle ermitteln. Dies ist das Maximum Anzahl der Monate an Daten, die aus dieser Tabelle benötigt werden, damit AML AI das Modell berechnen kann Funktionen für einen bestimmten Zeitraum.

  • Beispiel: Bei Engine-Versionen v004.004 sind dies 13 Monate für die Transaktion „AccountPartyLink“, 12 Monate für die Tabelle „RiskCaseEvent“ und „0“ Monate für „Party“ und „PartySupplementaryData“.

Der Datensatz muss das Rückschaufenster für alle Zeiträume abdecken, die für den ausgewählten Vorgang verwendet werden. Mit der folgenden Formel können Sie die Anzahl der vollständigen Kalendermonate mit Daten vor dem Endzeitpunkt berechnen, die Sie für einen bestimmten Vorgang benötigen:

  • Anzahl der Zeiträume + Lookback-Window – 1

Für die Optimierung von Engine-Versionen vom Typ v004.00X benötigen Sie beispielsweise:

  • 18 + 13 - 1 = Daten aus 30 Monaten aus der Transaktion und dem AccountPartyLink Tabellen,
  • 18 + 12 − 1 = 29 Monate Daten aus der Tabelle „Ereignisse für Risikofälle“ sowie alle neueren Ereignisse für Risikofälle in der Tabelle,
  • Und 18 + 0 - 1 = Daten aus 17 Monaten aus „Party“ und „PartySupplementaryData“ Tabellen.