Comprendere l'ambito e la durata dei dati

L'AI di AML è configurata per valutare il rischio di riciclaggio di denaro per una linea di business. Una LoB è associata a uno dei tuoi clienti di vendita al dettaglio o commerciali.

Quando crei un set di dati da utilizzare con una LoB, devi prima determinare l'intervallo di tempo per cui il set di dati deve coprire.

Intervallo di tempo del set di dati

L'intervallo di tempo è composto da tre parti:

Grafico dei requisiti dei dati storici

  • Finestra temporale principale: questo intervallo di tempo deve essere coperto da tutte le tabelle nel set di dati. Operazioni API diverse hanno requisiti diversi per la finestra temporale principale per la generazione di funzionalità ed etichette:

    • Creazione di una configurazione del motore (per l'ottimizzazione): almeno 18 mesi
    • Creazione di un modello (per l'addestramento): almeno 15 mesi
    • Creazione dei risultati della previsione (per il punteggio): minimo 1 mese
    • Creazione dei risultati del backtest (per il backtesting o la valutazione del modello): almeno 3 mesi, includi altri mesi per una valutazione più precisa

  • Finestra temporale: sono necessari altri 24 mesi di dati prima della finestra temporale principale per supportare le funzionalità del modello che tracciano l'attività nel tempo. I requisiti minimi della finestra temporale variano in base alla tabella.

  • Eventi di casi di rischio aggiuntivi: è possibile includere i dati su casi di rischio più recenti dell'ora di fine del set di dati in modo da avere etichette più complete per l'addestramento e la valutazione dei modelli.

Ad esempio, devi creare una configurazione motore per utilizzare il resto dell'AI AML. Devi creare un set di dati che copra almeno 42 mesi di dati sulle transazioni (18 mesi di periodo di tempo principale e 24 mesi di finestra temporale).

Tabelle da utilizzare

Per un determinato intervallo di tempo e LoB del core, il set di dati BigQuery utilizzato con l'AI AML deve contenere le seguenti tabelle:

  • Parte: tutte le parti pertinenti alla LoB per l'intera finestra temporale; non è richiesta alcuna finestra temporale.
    • LoB retail: tutti i clienti del settore retail che hanno detenuto conti in qualsiasi momento della finestra temporale principale
    • LoB commerciale: tutti i clienti bancari commerciali (entità legali e naturali) che hanno detenuto conti in un qualsiasi momento della finestra temporale principale
  • AccountPartyLink: cronologia completa degli account detenuti da quali parti per l'intero periodo di tempo principale e una finestra temporale di 24 mesi. Questo dovrebbe riguardare tutti gli account per prodotti e servizi quando una parte nella tabella Parte è (o era) il proprietario dell'account principale.
  • Transazione: tutte le transazioni per gli account nella tabella AccountPartyLink per l'intera finestra temporale principale e la finestra temporale di 24 mesi
  • RiskCaseEvent: tutti gli eventi relativi a casi di rischio (vedi i valori type dell'evento) per tutti i casi e le parti nella tabella Partito con un AML_PROCESS_START (inizio dell'indagine) nella finestra temporale principale e una finestra temporale minima di 12 mesi. Alcuni di questi eventi possono avere un'ora precedente o successiva rispetto alla finestra temporale principale e alla finestra temporale.
  • PartySupplementaryData: (se utilizzato) da 0 a 100 valori party_supplementary_data_id univoci, includi una cronologia completa dei valori di questi campi per tutte le parti nella tabella Party per la finestra temporale principale; non è richiesta alcuna finestra temporale.

Utilizzo di dati aggiuntivi (non contemplati nello schema AI AML)

Consulta la sezione Dati supplementari se disponi di dati aggiuntivi su parti (non contemplati nello schema) pertinenti all'identificazione del rischio di riciclaggio di denaro e questi dati non sono contemplati nello schema.