Glossario di AML AI

Questo glossario definisce i termini specifici di AML AI. Per i termini generali del machine learning, consulta il Glossario del machine learning.

A

ADC

Ognuna delle librerie client API fornisce un mezzo per utilizzare le credenziali predefinite dell'applicazione (ADC) locali

Per informazioni sulla differenza tra le credenziali ADC locali e le credenziali gcloud CLI, consulta Credenziali di gcloud CLI e credenziali ADC

B

backtesting
Il backtesting utilizza dati storici per valutare il rendimento (ricordo osservato) di un modello confrontando il punteggio di rischio che genera i risultati effettivi delle indagini storiche.
Risultati del backtest
Per testare le prestazioni di un modello su un set di dati, viene creata una risorsa BacktestResult di AML AI (nota anche come "risultati del backtest").
Per ulteriori informazioni, consulta Valutare un modello.

C

dati bancari principali
I
dati bancari di base includono dati su parti, transazioni e titoli di conto. Aiuta l'AI AML a comprendere i tuoi clienti e la loro attività bancaria per rilevare caratteristiche e comportamenti rischiosi.
finestra temporale core

La finestra temporale principale si riferisce all'intervallo di tempo utilizzato in una piattaforma AML AI operazioni (configurazione del motore, addestramento, backtesting e previsione) per generare addestramento, esempi di valutazione o output del modello. Questo intervallo di tempo deve essere coperto da tutte le tabelle del set di dati.

Le operazioni dell'API diverse hanno requisiti diversi per la finestra temporale dei core. per generare caratteristiche ed etichette. Per ulteriori informazioni, consulta Informazioni sull'ambito e sulla durata dei dati.

Vedi anche finestra temporale.

D

convalida dei dati
AML AI esegue dei controlli di convalida dei dati durante la creazione di un set di dati, configurazione del motore, modello, risultati backtest o risultati delle previsioni. Se set di dati specificato non supera la convalida dei dati, allora la risorsa non e vengono generati errori di convalida dei dati (che indicano la natura il problema).
Per ulteriori informazioni, vedi Errori di convalida dei dati.
dataset

Una risorsa set di dati di AML AI (o semplicemente "set di dati") viene utilizzato per specificare i dati, in conformità alle Modello dei dati di input AML, che può essere utilizzato per generare un modello. valutare le prestazioni di un modello e generare punteggi di rischio spiegabilità per parte.

Per saperne di più, consulta Informazioni sul modello di dati e sui requisiti AML.

E

end time

Le operazioni di AML AI che utilizzano un set di dati richiedono di specificare e ora di fine. Questo campo viene utilizzato per controllare quali mesi nel set di dati vengono utilizzati per generare esempi di addestramento o valutazione e output del modello.

L'ora di fine e tutti i mesi utilizzati per un'operazione devono rientrare nella data del set di dati associato.

Ad esempio, un'operazione di addestramento richiede una finestra temporale principale di 15 mesi. Se utilizzi un set di dati con un intervallo di date compreso tra il 15 ottobre 2021 e il 21 maggio 2023 e un'ora di fine pari al 12 aprile 2023, l'addestramento utilizza esempi dei mesi di calendario da gennaio 2022 a marzo 2023, che rientrano nell'intervallo di date del set di dati.

engine config

Una risorsa EngineConfig di AML AI (nota anche come "configurazione dell'engine") specifica i parametri per la generazione e la valutazione di un modello AML AI, nonché per la generazione di punteggi di rischio e di esplicabilità.

Alcuni di questi parametri vengono specificati nella chiamata API per creare un'impostazione motore, ad esempio la versione del motore e il volume di indagini previsto. Altri parametri vengono generati automaticamente dall'IA AML utilizzando un set di dati specificato, ad esempio gli iperparametri ottimizzati.

Per ulteriori informazioni, consulta la sezione Configurare un motore.

versione motore

Una risorsa EngineVersion dell'AI AML (nota anche come "versione dell'engine") definisce aspetti del modo in cui l'AI AML rileva il rischio, che include l'ottimizzazione, l'addestramento e la valutazione del modello, nonché il modello di dati AML complessivo e le famiglie di funzionalità.

La configurazione di un motore AI AML richiede di specificare una versione del motore da utilizzare. La versione del motore diventa quindi usata per addestrare e valutare i modelli con quella configurazione motore e per generare rischi punteggi e spiegabilità.

La denominazione delle versioni dell'engine è strutturata come segue, con il tipo di engine che esprime la linea di business supportata e il sottotipo di engine, la messa a punto, la versione principale e la versione secondaria aggiornate man mano che vengono implementati nuovi comportamenti.

Le versioni di esempio includono:

  • aml-retail.default.v004.000.202312-000
  • aml-commercial.default.v004.000.202312-000
Controllo delle versioni del motore

Per ulteriori informazioni sulla gestione delle versioni del motore, consulta Gestisci le versioni del motore.

valutazione

Vedi anche backtesting.

spiegabilità

I modelli di IA AML vengono usati per identificare le parti che comportamenti o caratteristiche ad alto rischio di riciclaggio di denaro. L'esplicabilità indica quali comportamenti o caratteristiche hanno contribuito maggiormente a un punteggio di rischio elevato per una determinata parte.

Per ulteriori informazioni, vedi Informazioni sugli output delle previsioni.

Vedi anche previsione.

esportare metadati

Diverse risorse di IA AML memorizzano informazioni aggiuntive relative al rendimento e alla qualità dei dati a cui è possibile accedere utilizzando l'operazione di esportazione dei metadati.

Per ulteriori informazioni, consulta Modello dei dati di output AML.

V

famiglia di funzionalità
Le famiglie di elementi sono raccolte di elementi di ML correlati, che forniscono una classificazione semplice e comprensibile per informare gli investigatori e i team di revisione interna.

I

entità immutabile

L'AI AML deve essere in grado di ricreare le visualizzazioni dei dati in diversi momenti per la regolazione, l'addestramento e il backtesting. Per raggiungere Questo, AML AI differenzia tra entità mutabili (ovvero possono modificare i valori nel tempo) e le entità immutabili (che non cambiano).

Ad esempio, un'entità mutabile potrebbe essere il saldo del tuo conto corrente, che può cambiare nel tempo, mentre un'entità immutabile potrebbe essere un evento, come il prelievo di 50 $ il 2 luglio 2024 alle 00:00:00 dal tuo conto corrente, che non cambia poiché si tratta di uno snapshot nel tempo.

Nel modello dei dati di input AML, le tabelle che rappresentano entità immutabili non hanno i campi validity_start_time e is_entity_deleted. È inclusa la tabella RiskCaseEvent.

Per ulteriori informazioni, vedi Informazioni sulle variazioni dei dati nel tempo.

Vedi anche entità mutabile.

instance

Una risorsa istanza di AML AI (nota anche come "istanza") si trova alla base di tutte le altre applicazioni di AML AI e devono essere creati prima di poter lavorare con altre risorse AML AI Google Cloud. È possibile creare più istanze nella stessa regione all'interno di un progetto.

Per ulteriori informazioni, consulta Creare un'istanza AML AI.

procedura di indagine

Un processo di indagine copre l'intera indagine o sequenza di indagini attivate da un avviso. Il processo inizia quando la prima parte di un'indagine inizia e termina quando non sono previsti ulteriori risultati da questa indagine.

Per ulteriori informazioni, vedi Ciclo di vita di un caso di rischio.

L

LOB
La line of business (LOB) contraddistingue i servizi bancari retail e commerciali in AML AI. I set di dati, le versioni del motore e la registrazione delle parti sono collegati a una specifica attività commerciale, di vendita al dettaglio o commerciale.
Finestra temporale

Oltre alla finestra temporale principale, le operazioni di IA AML richiedono che i set di dati includano una finestra di panoramica per consentire la generazione di funzionalità che monitorano il comportamento nel tempo.

Per ulteriori informazioni, vedi Comprendi l'ambito e la durata dei dati.

LRO

Diverse operazioni di AML AI, inclusa la configurazione del motore, l'addestramento, il backtesting e la previsione, avviano un'operazione a lunga esecuzione (LRO).

Per ulteriori informazioni, consulta Gestire le operazioni che richiedono molto tempo.

M

Mancanza

La metrica di mancanza viene calcolata per tutte le famiglie di funzionalità durante la creazione delle seguenti risorse di IA AML: configurazione dell'engine, modello, risultati del backtest e risultati di previsione.

Questa metrica mostra la percentuale di valori mancanti in tutte le funzionalità di una famiglia di funzionalità. Una variazione significativa dell'assenza per qualsiasi famiglia di funzionalità tra ottimizzazione, addestramento, valutazione e previsione può indicare incoerenza nei set di dati utilizzati.

modello

Una risorsa modello di IA AML (nota anche come "modello") rappresenta un modello addestrato che può essere utilizzato per generare punteggi di rischio e spiegabilità.

entità modificabile

AML AI deve essere in grado di ricreare le viste dei dati diversi momenti per l'ottimizzazione, l'addestramento e il backtesting. Per raggiungere Questo, AML AI differenzia tra entità modificabili (che possono cambiano i valori nel tempo) ed entità immutabili (che non cambiano).

Ad esempio, un'entità modificabile potrebbe essere il saldo del conto corrente, che possono cambiare nel tempo; ma un'entità immutabile potrebbe essere un evento, prelevare 50 $il 2 luglio 2024 alle 12:00:00 dal tuo conto corrente, che non cambia poiché si tratta di un'istantanea nel tempo.

Nel modello dei dati di input AML, le tabelle che rappresentano entità modificabili con i campi validity_start_time e is_entity_deleted. Sono inclusi Party, AccountPartyLink, Transaction e PartySupplementaryData.

Per ulteriori informazioni, consulta la sezione Informazioni su come cambiano i dati nel tempo.

Vedi anche entità immutabile.

O

observed-recall

AML AI misura le prestazioni del modello sui dati storici utilizzando Metrica Richiamo osservato.

Questa metrica mostra la proporzione di parti con etichetta positiva (ad es. abbandoni dei clienti) di un periodo selezionato che sarebbero state identificate come ad alto rischio durante un periodo di attività sospette dal modello in fase di valutazione.

P

festa

Nel modello dei dati di input AML, una parte rappresenta un cliente del banca. Una parte può essere una persona fisica o una persona giuridica.

Per ulteriori informazioni, consulta la tabella Partito.

Vedi anche la parte registrata.

previsione

La previsione utilizza un modello per generare punteggi di rischio e spiegabilità che può essere utilizzata nel tuo account AML processo di indagine.

risultati di previsione

Una risorsa PredictionResult di AML AI (noti anche come "risultati della previsione") è il risultato dell'utilizzo di un modello per creare per le previsioni.

Per ulteriori dettagli su come generare punteggi di rischio e spiegabilità, nonché su come utilizzarli nella procedura di indagine, consulta le pagine della sezione Generare punteggi di rischio e spiegabilità.

R

parte registrata
Prima che un partito possa essere utilizzato per creare risultati di previsione (ad esempio, punteggi di rischio e spiegabilità a livello di partito), il partito deve essere registrato per la linea di business corrispondente.
caso di rischio

Un caso di rischio riguarda un processo di indagine o un gruppo di processi di indagine per parti diverse.

Consulta la tabella RiskCaseEvent.

Dati relativi alle indagini sui rischi

I dati dell'indagine del rischio vengono utilizzati da AML AI per comprendere il processo e i risultati di indagine del rischio e generare etichette di addestramento.

punteggio di rischio

I modelli AML AI vengono utilizzati per identificare le parti che mostrano comportamenti o caratteristiche con un rischio elevato di riciclaggio di denaro. Fatto attraverso un punteggio di rischio.

I punteggi di rischio variano da 0 a 1. Un punteggio più alto indica un rischio maggiore. Tuttavia, i punteggi di rischio non devono essere interpretati direttamente come una probabilità attività di riciclaggio.

Per ulteriori informazioni, consulta Informazioni sugli output di previsione.

tipologia di rischio

AML AI può identificare il rischio di riciclaggio di denaro cinque tipi principali di rischio AML relativi al monitoraggio delle transazioni.

Con dati sufficienti delle parti e dati supplementari (vedi le tabelle Dati supplementari), l'IA AML può coprire più tipologie.

S

Dati supplementari

Per dati supplementari si intendono dati aggiuntivi, oltre a quelli contenuti nei dati bancari principali e dati di indagine sui rischi aree dello schema AML AI, che è pertinente per prevedere il rischio di riciclaggio di denaro.

Ad esempio, potresti identificare e aggiungere un indicatore di rischio che aiuti i modelli a predire meglio una tipologia di rischio che altrimenti non è ben coperta.

È possibile aggiungere dati supplementari a un set di dati utilizzando Tabella PartySupplementaryData.

periodo di attività sospetta

Un periodo di attività sospette è un periodo di tempo in cui ritieni che la parte investigata ha manifestato un comportamento sospetto. Viene utilizzato nel modello (ad esempio, la metrica di richiamo per i risultati del backtest) per confermare i clienti ad alto rischio vengano identificati nei mesi in cui avevano attività sospette.

Per ulteriori informazioni, consulta Ciclo di vita di un caso di rischio.

T

addestramento
AML AI svolge l'addestramento come parte della creazione di un modello (vedi ottimizzazione) di una configurazione del motore specificata.
tuning
L'ottimizzazione è l'ottimizzazione degli iperparametri del modello. IA AML l'ottimizzazione nell'ambito della creazione di una configurazione del motore.

V

ora di inizio validità

L'ora di inizio della validità di un'entità mutabile viene utilizzata dall'AI AML per creare una visualizzazione di ciò che era noto alla banca in un determinato momento. In questo modo, l'IA AML può addestrare con precisione modelli che possono essere riutilizzati sui dati più recenti (ovvero quelli noti alla banca) per produrre punteggi di rischio ad alta fedeltà.

L'ora di inizio della validità per una determinata riga rappresenta il primo momento in cui i dati di questa riga era noto alla banca e corretto.

Per ulteriori informazioni, vedi Informazioni sulle variazioni dei dati nel tempo.