Glossario di AML AI

Questo glossario definisce i termini specifici di AML AI. Per termini generali relativi al machine learning, consulta il glossario del machine learning.

B

test retrospettivo

Il backtesting utilizza i dati storici per valutare le prestazioni (richiamo osservato) di un modello confrontando i punteggi di rischio che genera con i risultati effettivi delle indagini storiche.

risultati del backtest

Viene creata una risorsa BacktestResult AML AI (nota anche come "risultati del backtest") per testare le prestazioni di un model su un set di dati. Per maggiori informazioni, consulta Valutare un modello.

C

dati bancari di base

I dati bancari principali includono i dati su parti, transazioni e titolari di conti. Aiuta AML AI a comprendere i clienti e la loro attività bancaria per rilevare caratteristiche e comportamenti rischiosi.

finestra temporale del core

La finestra temporale per i core si riferisce all'intervallo di tempo utilizzato in un'operazione di AML AI (configurazione motore, addestramento, backtest e previsione) per la generazione di addestramento, esempi di valutazione o output del modello. Questo intervallo di tempo deve essere coperto da tutte le tabelle nel set di dati.

Operazioni API diverse hanno requisiti diversi per la finestra temporale principale per generare caratteristiche ed etichette. Per maggiori informazioni, consulta Comprendere l'ambito e la durata dei dati.

D

set di dati

Una risorsa del set di dati (o solo "set di dati") AML AI viene utilizzata per specificare i dati, in conformità al modello di dati di input AML, che può essere utilizzata per generare un modello, valutare le prestazioni di un modello e generare punteggi di rischio e spiegabilità per parte. Per maggiori informazioni, consulta Comprendere i requisiti e il modello dei dati AML.

convalida dei dati

AML AI esegue controlli di convalida dei dati durante la creazione di un set di dati, di una configurazione motore, di un modello, di risultati del backtest o di una previsione. Se il set di dati specificato non supera la convalida dei dati, la risorsa non viene creata e vengono generati errori di convalida dei dati (indicando la natura del problema). Per ulteriori informazioni, consulta Errori di convalida dei dati.

E

ora di fine

Le operazioni di AML AI che utilizzano un set di dati richiedono di specificare un'ora di fine. Questo campo viene utilizzato per controllare quali mesi nel set di dati vengono utilizzati per generare esempi di addestramento o valutazione e output del modello.

L'ora di fine e tutti i mesi utilizzati per un'operazione devono rientrare nell'intervallo di date del set di dati associato. Ad esempio, un'operazione di addestramento richiede una finestra temporale dei core di 15 mesi. Se utilizzi un set di dati con un intervallo di date compreso tra il 15 ottobre 2021 e il 21 maggio 2023 e la data di fine il 12 aprile 2023, l'addestramento utilizza esempi dei mesi di calendario da gennaio 2022 a marzo 2023, che rientrano nell'intervallo di date del set di dati.

configurazione motore

Una risorsa EngineConfig AML AI (nota anche come "configurazione motore") specifica i parametri nella generazione e nella valutazione di un modello AML AI e nella generazione di punteggi di rischio e spiegabilità.

Alcuni di questi parametri sono specificati nella chiamata API per creare una configurazione motore, ad esempio la versione del motore e il volume di indagine previsto. Altri parametri vengono generati automaticamente da AML AI utilizzando un set di dati specificato, ad esempio iperparametri ottimizzati. Per ulteriori informazioni, consulta la sezione Configurare un motore.

versione del motore

Una risorsa EngineVersion AML AI (nota anche come "versione motore") definisce aspetti del modo in cui AML AI rileva il rischio, che comprende l'ottimizzazione, l'addestramento e la valutazione del modello, nonché il modello dei dati AML complessivo e le famiglie di caratteristiche.

La configurazione di un motore AML AI richiede di specificare una versione del motore da utilizzare. La versione del motore viene quindi utilizzata per addestrare e valutare i modelli con quella configurazione motore, nonché per generare punteggi di rischio e spiegabilità.

La denominazione delle versioni del motore è strutturata come segue, con il tipo di motore che indica la linea di business supportata, mentre le versioni di sottotipo, ottimizzazione, principali e secondarie del motore vengono aggiornate man mano che vengono implementati nuovi comportamenti. Le versioni di esempio includono aml-retail.default.v004.000.202312-000 e aml-commercial.default.v004.000.202312-000.

Controllo delle versioni del motore

Per saperne di più sulla gestione delle versioni del motore, consulta Gestione delle versioni del motore.

valutazione

Consulta il backtest.

spiegabilità

I modelli AML AI vengono utilizzati per identificare le parti che mostrano comportamenti o caratteristiche ad alto rischio di riciclaggio di denaro. La spiegabilità indica quali comportamenti o caratteristiche hanno contribuito maggiormente a un punteggio ad alto rischio per una determinata parte. Per ulteriori informazioni, consulta Comprendere gli output di previsione.

esporta metadati

Diverse risorse di AML AI archiviano informazioni aggiuntive relative alle prestazioni e alla qualità dei dati, a cui è possibile accedere utilizzando l'operazione dei metadati di esportazione. Per maggiori informazioni, consulta Modello dei dati di output AML.

V

famiglia di caratteristiche

Le famiglie di funzionalità sono raccolte di caratteristiche ML correlate, che forniscono una categorizzazione semplice e comprensibile per informare gli investigatori e i team di audit interni.

I

entità immutabile

AML AI deve essere in grado di ricreare le visualizzazioni dei dati in diversi momenti per l'ottimizzazione, l'addestramento e il backtest. Per ottenere questo risultato, AML AI distingue tra entità modificabili, ovvero entità che possono cambiare i valori nel tempo, ed entità immutabili, come gli eventi, che, una volta creati o verificati, non cambiano in modo ragionevole.

Nel modello dei dati di input AML, le tabelle che rappresentano entità immutabili non hanno i campi validity_start_time e is_entity_deleted. compresa la tabella RiskCaseEvent. Per saperne di più, consulta Comprendere come cambiano i dati nel tempo.

Vedi anche Entità modificabile.

istanza

Una risorsa istanza di AML AI (nota anche come "istanza") si trova alla base di tutte le altre risorse AML AI e deve essere creata prima di poter lavorare con altre risorse AML AI. È possibile creare più istanze nella stessa regione all'interno di un progetto. Per maggiori informazioni, consulta Creare un'istanza AML AI.

processo di indagine

Un processo di indagine copre l'intera indagine o sequenza di indagini attivate da un avviso. Il processo inizia all'inizio della prima parte dell'indagine e termina quando non sono previsti ulteriori risultati dall'indagine. Per ulteriori informazioni, consulta Ciclo di vita di un caso di rischio.

L

line of business (LOB)

Questa linea di business distingue i clienti bancari retail e commerciali in AML AI. I set di dati, le versioni del motore e la registrazione di parti sono collegati a uno specifico settore di attività, vendita al dettaglio o commerciale.

operazione a lunga esecuzione (LRO)

Diverse operazioni di AML AI, tra cui configurazione del motore, addestramento, backtest e previsione, avviano un'operazione a lunga esecuzione (LRO). Per maggiori informazioni, consulta Gestire le operazioni a lunga esecuzione.

finestra temporale

Oltre alla finestra temporale principale, le operazioni di AML AI richiedono che i set di dati includano una finestra temporale per consentire la generazione di funzionalità che monitorano il comportamento nel tempo. Per maggiori informazioni, consulta Comprendere l'ambito e la durata dei dati.

M

Mancanza

La metrica Mancanza viene calcolata per tutte le famiglie di caratteristiche durante la creazione delle seguenti risorse AML AI: configurazione motore, modello, risultati del backtest e risultati della previsione.

Questa metrica mostra la quota dei valori mancanti in tutte le caratteristiche di una famiglia di caratteristiche. Un cambiamento significativo della mancanza di caratteristiche per qualsiasi famiglia di caratteristiche tra ottimizzazione, addestramento, valutazione e previsione può indicare incoerenze nei set di dati utilizzati.

model

Una risorsa del modello AML AI (nota anche come "modello") rappresenta un modello addestrato che può essere utilizzato per generare punteggi di rischio e spiegabilità.

entità modificabile

AML AI deve essere in grado di ricreare le visualizzazioni dei dati in diversi momenti per l'ottimizzazione, l'addestramento e il backtest. Per raggiungere questo obiettivo, AML AI fa distinzione tra entità che possono cambiare i valori nel tempo ed entità immutabili, come gli eventi, che, una volta che si verificano o si verificano, non cambiano in modo ragionevole.

Nel modello dei dati di input AML, le tabelle che rappresentano entità modificabili hanno i campi validity_start_time e is_entity_deleted. Ciò include le tabelle Party, AccountPartyLink,Transaction e PartySupplementaryData. Per saperne di più, vedi Comprendere come cambiano i dati nel tempo.

Vedi anche Entità immutabile.

O

ricordo osservato

AML AI misura le prestazioni del modello in base ai dati storici usando la metrica Richiamo osservato.

Questa metrica mostra la proporzione di parti etichettate positive (ad esempio, uscite di clienti) di un periodo selezionato che sarebbero state identificate durante un periodo di attività sospetta come ad alto rischio dal modello valutato.

P

parte

Nel modello dei dati di input AML, una parte rappresenta un cliente della banca. Una parte può essere una persona fisica o una persona giuridica. Per ulteriori informazioni, consulta la tabella Partito. Vedi anche parte registrata.

la previsione.

La previsione utilizza un modello per generare punteggi di rischio e spiegabilità che possono essere utilizzati nel processo di indagine AML.

risultati della previsione

Una risorsa PredictionResult di AML AI (nota anche come "risultati di previsione") è il risultato dell'utilizzo di un modello per creare previsioni. Per ulteriori dettagli su come generare punteggi di rischio e spiegabilità e su come utilizzarli nel processo investigativo, consulta le pagine nella sezione Generare punteggi di rischio e spiegabilità.

R

parte registrata

Prima che una parte possa essere utilizzata per creare risultati di previsione (ad esempio, punteggi di rischio e spiegabilità a livello di parte), questa deve essere registrata per la linea di business corrispondente.

caso di rischio

Un caso di rischio riguarda un processo di indagine o un gruppo di procedure di indagine correlate per diverse parti.

Consulta la tabella RiskCaseEvent.

dati sull'indagine sui rischi

AML AI usa i dati dell'analisi dei rischi per comprendere il processo e i risultati dell'analisi del rischio, nonché per generare etichette di addestramento.

punteggio di rischio

I modelli AML AI vengono utilizzati per identificare le parti che mostrano comportamenti o caratteristiche ad alto rischio di riciclaggio di denaro. Questo viene fatto attraverso un punteggio di rischio.

I punteggi di rischio variano da 0 a 1. Un punteggio più alto indica un rischio più elevato. Tuttavia, i punteggi di rischio non devono essere interpretati direttamente come una probabilità di attività di riciclaggio di denaro. Per ulteriori informazioni, consulta Comprendere gli output di previsione.

tipologia di rischio

AML AI è in grado di identificare il rischio di riciclaggio di denaro in cinque tipologie di rischio AML principali relative al monitoraggio delle transazioni.

Con una quantità sufficiente di dati di indagine e di parte supplementari (consulta le tabelle Dati supplementari), AML AI può coprire più tipologie.

S

dati supplementari

I dati supplementari sono dati aggiuntivi che vanno oltre quelli contenuti nelle aree dei dati bancari principali e dei dati di indagine dei rischi dello schema AML AI, che sono pertinenti per prevedere il rischio di riciclaggio di denaro. Ad esempio, potresti identificare e aggiungere un indicatore di rischio che aiuti i modelli a prevedere meglio una tipologia di rischio che altrimenti non sarebbe ben trattata.

È possibile aggiungere dati supplementari a un set di dati utilizzando la tabella PartySupplementaryData.

periodo di attività sospetta

Un periodo di attività sospetta è un periodo di tempo in cui ritieni che una parte investigata abbia mostrato comportamenti sospetti. Viene utilizzata nella valutazione del modello (ad esempio, la metrica del richiamo per i risultati dei backtest) per confermare che i clienti ad alto rischio vengono identificati durante i mesi in cui hanno avuto attività sospette. Per ulteriori informazioni, consulta Ciclo di vita di un caso di rischio.

T

modello

AML AI esegue l'addestramento nell'ambito della creazione di un modello utilizzando gli iperparametri (vedi l'ottimizzazione) da una configurazione motore specificata.

ottimizzazione

L'ottimizzazione consiste nell'ottimizzazione degli iperparametri del modello. AML AI esegue l'ottimizzazione nell'ambito della creazione di una configurazione del motore.

V

ora di inizio validità

L'ora di inizio della validità di un'entità modificabile viene utilizzata da AML AI per creare una vista di ciò che era noto alla banca in un determinato momento. Ciò consente ad AML AI di addestrare con precisione i modelli che possono essere riutilizzati sui dati più recenti (ossia quelli attualmente noti dalla banca) per produrre punteggi di rischio di alta fedeltà. L'ora di inizio della validità di una determinata riga rappresenta la prima volta in cui i dati in questa riga sono stati noti alla banca e sono corretti. Per saperne di più, consulta Comprendere come cambiano i dati nel tempo.