Comprendere l'ambito e la durata dei dati

L'AML AI è configurata per valutare il rischio di riciclaggio di denaro per una linea di business. Un'attività commerciale è associata a uno dei tuoi clienti commerciali o di vendita al dettaglio.

Quando crei un set di dati da utilizzare con un'attività di business, devi includere diverse tabelle. Ogni tabella deve coprire un intervallo di tempo sufficiente. Questa pagina fornisce una panoramica delle tabelle di cui avrai bisogno e mostra come determinare l'intervallo di tempo che ciascuna deve coprire.

Tabelle da utilizzare

Il set di dati BigQuery utilizzato con l'AI AML deve contenere le seguenti tabelle:

  • Parte: tutte le parti pertinenti a tale LoB.
    • LoB di vendita al dettaglio: tutti i clienti di servizi bancari al dettaglio che hanno aperto un conto in qualsiasi momento nell'intervallo di tempo richiesto
    • LoB commerciale: tutti i clienti bancari commerciali (persone giuridiche e fisiche) che hanno aperto un conto in qualsiasi momento nell'intervallo di tempo richiesto
  • AccountPartyLink: cronologia completa degli account che sono stati da quali parti. Deve riguardare tutti gli account per i prodotti e quando una delle parti incluse nella tabella Partito è il proprietario principale dell'account in in qualsiasi momento nell'intervallo di tempo richiesto.
  • Transazione: tutte le transazioni per gli account nella tabella AccountPartyLink per l'intervallo di tempo richiesto.
  • RiskCaseEvent: tutti gli eventi relativi alle richieste di informazioni sui rischi (vedi i valori del tipo di evento) per qualsiasi richiesta di informazioni sui rischi e parte nella tabella Party con un valore AML_PROCESS_START (inizio dell'indagine) nell'intervallo di tempo richiesto. Questo la tabella può includere eventi la cui data/ora è precedente o successiva alla data nell'intervallo di tempo richiesto.
  • PartySupplementaryData: (se utilizzato) per un numero compreso tra 0 e 100 i valori party_supplementary_data_id, includono una cronologia completa dei valori campi per tutte le parti nella tabella delle parti per l'intervallo di tempo richiesto.

Utilizzo di dati aggiuntivi

Consulta la sezione Dati supplementari se hai dati aggiuntivi sulle parti. (non altrimenti trattati nello schema) pertinenti per l'identificazione di denaro rischio di riciclaggio.

Intervallo di tempo del set di dati

L'intervallo di tempo che deve essere coperto da qualsiasi tabella in un set di dati può essere calcolato come per una determinata operazione. Devi conoscere:

  • L'ora di fine. Questa è l'ora più recente da cui vengono utilizzate le etichette e da cui vengono utilizzati i dati per generare caratteristiche per l'ottimizzazione.
  • La versione del motore (consulta l'elenco delle versioni del motore) che utilizzerai.
  • L'operazione che eseguirai: ottimizzazione, addestramento, previsione o backtest.
  • Per le operazioni di previsione o di backtest, il numero di periodi per i quali eseguirai l'operazione, da specificare nella chiamata API.

Comprendi la durata dell'ambito dei dati

Innanzitutto, devi calcolare il numero di periodi che verranno utilizzati per l'operazione. Si tratta del numero di mesi consecutivi che terminano nell'ultimo mese di calendario completo precedente all'ora di fine specificata, per i quali l'AI AML valuterà le funzionalità del modello.

  • Per le operazioni di previsione e backtest, questo è il numero di previsioni o periodi di backtest specificati nella chiamata API.
  • Per le altre operazioni, dipende dalla versione del motore e dall'operazione. Ad esempio, le versioni v004.004 del motore utilizzano 18 punti per l’ottimizzazione e 15 per addestramento.

A questo punto devi calcolare la finestra temporale per ogni tabella. Questo è il numero massimo numero di mesi di dati necessari da quella tabella affinché AML AI possa calcolare il modello caratteristiche per un determinato periodo.

  • Ad esempio, per le versioni del motore v004.004, il tempo di transazione è di 13 mesi e AccountPartyLink, 12 mesi per la tabella RiskCaseEvent e 0 mesi per le tabelle Party e PartySupplementaryData.

Il set di dati dovrà coprire il periodo di tempo di tutti i periodi utilizzati dall'operazione scelta. Puoi calcolare il numero di mesi di calendario interi di dati precedenti all'ora di fine di cui avrai bisogno per una determinata operazione con la seguente formula:

  • numero di periodi + finestra temporale -1

Ad esempio, per le versioni del motore v004.00X che eseguono l'ottimizzazione, sono necessari:

  • 18 + 13 - 1 = 30 mesi di dati delle tabelle Transaction e AccountPartyLink,
  • 18 + 12 - 1 = 29 mesi di dati della tabella degli eventi dei casi di rischio nonché altri eventi recenti per i casi di rischio nella tabella,
  • E 18 + 0 - 1 = 17 mesi di dati da Party e PartySupplementaryData tabelle.