Panoramica
Questa pagina fornisce una panoramica dei processi di IA AML e illustra i concetti chiave che i clienti devono conoscere. È rivolto principalmente ai team che utilizzeranno l'IA AML per addestrare, testare ed eseguire il deployment dei modelli.
L'AML AI consente alle banche di addestrare, testare ed eseguire il deployment automatico di modelli per il rilevamento del riciclaggio di denaro. Le guide sull'IA AML sono suddivise in cinque sezioni di navigazione a sinistra che corrispondono ai cinque passaggi riportati di seguito.
Passaggio | Descrizione |
---|---|
1. Configura AML AI | Assicurati che il tuo progetto Google Cloud sia pronto per utilizzare AML AI. Abilita i servizi Google Cloud richiesti e configura il logging e le quote. Crea una o più istanze di AML AI. |
2. Preparare i dati per l'IA AML | Esamina il modello e lo schema dei dati. Assegna la priorità ai dati da includere. Raccogliere e trasformare i necessari dati bancari essenziali e l'indagine sui rischi e tutti gli altri dati di cui hai bisogno. Creare e convalidare un set di dati. |
3. Generare un modello e valutare le prestazioni | Comprendi i motori, i modelli e il backtesting dell'AI AML.
|
4. Genera punteggi di rischio e spiegabilità | Registra i tuoi clienti bancari al dettaglio e commerciali. Utilizza un modello per
generare punteggi di rischio per parte e spiegabilità per:
|
5. Preparati alla governance del modello e del rischio | Combina gli output dell'IA AML dall'ottimizzazione, dall'addestramento, dalla valutazione e dalla previsione con la documentazione del prodotto e dei concetti AML per soddisfare i requisiti della procedura di gestione del rischio del modello. |
Le operazioni tecniche principali di AML AI per creare, testare ed eseguire il deployment sono i seguenti. Questi supportano i passaggi 2-4 della tabella precedente.
- Create AML AI Dataset: crea un insieme strutturato di Tabelle di dati di input BigQuery per AML AI
- Configurazione del motore: imposta un motore AML AI su un Set di dati di AML AI, inclusa l'ottimizzazione degli iperparametri
- Addestramento del modello: addestra un modello AI AML utilizzando un motore Configurazione e un set di dati
- Backtest: testa un modello di IA AML rispetto ai dati storici di un set di dati e riassume le prestazioni
- Parti registrate: registra le parti (clienti della banca che hanno prodotti bancari e di inviare o ricevere transazioni) in modo che possano essere previsione
- Previsione: genera punteggi dei partiti e spiegabilità per l'utilizzo in produzione
La configurazione dell'engine, l'addestramento del modello, il backtest del modello e la previsione del modello richiedono tutti un set di dati di AI AML come input e restituiscono gli elementi corrispondenti utilizzati in altre operazioni. Ad esempio, Addestramento del modello restituisce un riferimento a un modello di AI AML addestrato che può essere utilizzato per il backtest o la previsione. Per i dettagli tecnici delle operazioni, consulta la Panoramica del riferimento REST.
Albero delle dipendenze per i processi di IA AML
Considerazioni importanti per l'utilizzo dell'IA AML
Questa sezione è stata pensata per offrire ai clienti un'introduzione ai concetti chiave di AML AI e fornire consulenza su alcune best practice. Gli argomenti qui sono più dettagliatamente nelle guide dedicate e nei link sono forniti per ulteriori per la lettura.
Coerenza delle date
AML AI utilizza periodi di tempo diversi per operazioni diverse. È necessario prestare attenzione alle date selezionate per ogni operazione per garantire risultati affidabili. In particolare, per evitare bias nei risultati, è importante che i mesi utilizzati per l'addestramento di un modello di IA AML non si sovrappongano ai mesi utilizzati per il backtesting.
Poiché un set di dati di IA AML contiene dati di molti mesi, i set di dati possono essere utilizzati per più operazioni, in base a queste selezioni di date corrette. Il seguente diagramma illustra un ciclo di sviluppo che utilizza l'IA AML, dove vengono utilizzati periodi di tempo diversi all'interno di un singolo set di dati che coprono 42 mesi per configurare un motore (ottimizzazione degli iperparametri), l'addestramento e il backtesting. Tutte queste procedure utilizzano finestre temporali che forniscono un contesto al modello e possono sovrapporsi in sicurezza ai dati utilizzati per altre operazioni.
Per ulteriori informazioni su set di dati AML AI e finestre temporali per diversi vedi Comprendere l'ambito e la durata dei dati.
Per assicurarti di registrare correttamente le modifiche ai dati nel tempo, consulta Modifiche ai dati nel tempo.
Frequenza batch di produzione
Nella previsione, l'IA AML produce punteggi di rischio AML su base mensile di calendario. I clienti usano comunemente AML AI come parte di un processo batch mensile si consiglia di eseguire previsioni sui mesi con dati completi sulle transazioni tanto quanto possibile.
Coerenza dei campi
Come con qualsiasi processo di machine learning, i dati devono essere il più coerenti possibile tra dati di addestramento e dati di test. Se i campi non vengono compilati in modo coerente, le modifiche potrebbero causare risultati inaffidabili. È vivamente consigliato adottare misure per garantire che i campi vengano compilati in modo coerente per ogni operazione in un ciclo di sviluppo, soprattutto se vengono utilizzati set di dati diversi per ogni operazione. Per ulteriori informazioni, consulta la sezione relativa alla coerenza dei set di dati.
Configurazioni motore
Dopo aver creato una configurazione del motore, solitamente non è necessario ricrearla per ogni nuovo set di dati o in ogni ciclo di sviluppo. Gli iperparametri scelto in una configurazione dell'engine per un set di dati in genere hanno un buon rendimento su set di dati simili.
I cicli di sviluppo iterativi sono illustrati nel seguente diagramma, mentre il diagramma precedente utilizza un unico set di dati sia per le operazioni di addestramento del modello sia per quelle di backtest.
Per ulteriori informazioni, vedi quando eseguire la regolazione o l'ereditarietà.
Derivazione dei dati
La maggior parte dei criteri di governance dei modelli definisce un requisito per monitorare la derivazione dei dati utilizzata in tutte le operazioni di ML, dalla configurazione, l'addestramento, la valutazione la previsione. I clienti sono responsabili del monitoraggio di questa derivazione dei dati.
Consigliamo di utilizzare un identificatore univoco nei nomi per tutti i dati di input, le risorse di IA AML e i dati di output per tenere traccia della derivazione tra le fasi. Ciò contribuisce a garantire un collegamento stabile tra le risorse in una determinata esecuzione. I clienti possono anche etichettare tutte le risorse AML AI per far fronte alla derivazione i tuoi requisiti.
Inoltre, consigliamo di utilizzare gli snapshot BigQuery nelle richieste API per garantire una derivazione accurata dei dati.
Questa configurazione consente di rispondere a domande come "da dove proviene questa configurazione dell'engine?" e "da dove proviene questo modello?", nonché di esaminare e risolvere gli incidenti.
Per maggiori dettagli su come creare e gestire le risorse AML AI, consulta i Pagine relative alle API REST.