Panoramica della procedura

Panoramica

Questa pagina fornisce una panoramica delle procedure di IA AML e illustra i concetti chiave che i clienti devono conoscere. È rivolto principalmente ai team che utilizzeranno l'AI AML per addestrare, testare ed eseguire il deployment dei modelli.

L'AML AI consente alle banche di addestrare, testare ed eseguire il deployment automatico di modelli per il rilevamento del riciclaggio di denaro. Le guide sull'IA AML sono suddivise in cinque sezioni di navigazione a sinistra che corrispondono ai cinque passaggi riportati di seguito.

PassaggioDescrizione
1. Configura AML AI Assicurati che il tuo Google Cloud progetto sia pronto per l'utilizzo dell'AI AML. Attiva i servizi Google Cloud richiesti e configura il logging e le quote. Crea una o più istanze di AML AI.
2. Preparare i dati per l'AI AML Esamina il modello e lo schema dei dati. Assegna la priorità ai dati da includere. Raccogliere e trasformare i dati bancari di base, i dati di indagine sul rischio e tutti gli altri dati di cui hai bisogno. Crea e convalida un set di dati.
3. Genera un modello e valuta le prestazioni Comprendi i motori, i modelli e il backtesting dell'AI AML.
  1. Configurare un motore
  2. Addestra un modello
  3. Valutare le prestazioni di un modello
4. Genera punteggi di rischio e spiegabilità Registra i tuoi clienti di servizi bancari retail e commerciali. Utilizza un modello per generare punteggi di rischio per parte e spiegabilità per:
  • Analisi e test per la governance del rischio
  • Utilizzo in pre-produzione e produzione
5. Preparati alla governance del modello e del rischio Combina gli output dell'IA AML dall'ottimizzazione, dall'addestramento, dalla valutazione e dalla previsione con la documentazione del prodotto e dei concetti AML per soddisfare i requisiti della procedura di gestione del rischio del modello.

Le operazioni tecniche di IA AML di base per creare, testare e implementare i modelli sono le seguenti. Questi supportano i passaggi 2-4 della tabella precedente.

  1. Crea set di dati AML AI: crea un insieme strutturato di tabelle di dati di input BigQuery per l'AI AML
  2. Configurazione del motore: ottimizza un motore AML AI per un set di dati AML AI, inclusa l'ottimizzazione degli iperparametri
  3. Addestramento del modello: addestra un modello di IA AML utilizzando una configurazione dell'engine e un set di dati
  4. Backtest: testa un modello di IA AML rispetto ai dati storici di un set di dati e riassume le prestazioni
  5. Registra parti: registra le parti (clienti della banca che dispongono di prodotti bancari e inviano o ricevono transazioni) in modo che possano ricevere un punteggio nella previsione
  6. Previsione: genera punteggi dei partiti e spiegabilità per l'utilizzo in produzione

La configurazione dell'engine, l'addestramento del modello, il backtest del modello e la previsione del modello richiedono tutti un set di dati di AI AML come input e restituiscono gli elementi corrispondenti utilizzati in altre operazioni. Ad esempio, Model Training restituisce un riferimento a un modello di IA AML addestrato che può essere utilizzato per il backtest o la previsione. Per i dettagli tecnici delle operazioni, consulta la Panoramica del riferimento REST.

Albero delle dipendenze per i processi di IA AML

Albero delle dipendenze per i processi di IA AML

Considerazioni importanti per l'utilizzo dell'AI AML

Questa sezione è progettata per fornire ai clienti un'introduzione ai concetti chiave dell'IA AML e consigliare alcune best practice. Gli argomenti trattati qui sono approfonditi in guide dedicate e sono forniti link per approfondire.

Coerenza delle date

L'AI AML utilizza periodi di tempo diversi per operazioni diverse. È necessario prestare attenzione alle date selezionate per ogni operazione per garantire risultati affidabili. In particolare, per evitare bias nei risultati, è importante che i mesi utilizzati per l'addestramento di un modello di IA AML non si sovrappongano ai mesi utilizzati per il backtesting.

Poiché un set di dati di IA AML contiene dati di molti mesi, i set di dati possono essere utilizzati per più operazioni, in base a queste selezioni di date corrette. Il seguente diagramma illustra un ciclo di sviluppo che utilizza l'IA AML, dove vengono utilizzati periodi di tempo diversi all'interno di un singolo set di dati che coprono 42 mesi per configurare un motore (ottimizzazione degli iperparametri), l'addestramento e il backtesting. Tutte queste procedure utilizzano finestre temporali che forniscono un contesto al modello e possono sovrapporsi in sicurezza ai dati utilizzati per altre operazioni.

Per ulteriori informazioni sui set di dati AML AI e sulle finestre temporali per operazioni diverse, consulta Informazioni sull'ambito e sulla durata dei dati.

Per assicurarti di registrare correttamente le modifiche ai dati nel tempo, consulta Modifiche ai dati nel tempo.

Creare un set di dati AML AI: passaggi 1-4

Frequenza dei batch di produzione

Nella previsione, l'IA AML produce punteggi di rischio AML su base mensile di calendario. I clienti utilizzano comunemente l'IA AML nell'ambito di una procedura batch mensile e si consiglia di eseguire le previsioni nei mesi con dati sulle transazioni completi, se possibile.

Coerenza dei campi

Come per qualsiasi processo di machine learning, i dati devono essere il più coerenti possibile tra i dati di addestramento e i dati di test. Se i campi non vengono compilati in modo coerente, le modifiche potrebbero causare risultati inaffidabili. È vivamente consigliato adottare misure per garantire che i campi vengano compilati in modo coerente per ogni operazione in un ciclo di sviluppo, soprattutto se vengono utilizzati set di dati diversi per ogni operazione. Per ulteriori informazioni, consulta la sezione relativa alla coerenza dei set di dati.

Configurazioni del motore

Una volta creata una configurazione dell'engine, in genere non è necessario ricrearla per ogni nuovo set di dati o in ogni ciclo di sviluppo. Gli iperparametri scelto in una configurazione dell'engine per un set di dati in genere hanno un buon rendimento su set di dati simili.

I cicli di sviluppo iterativi sono illustrati nel seguente diagramma, mentre il diagramma precedente utilizza un unico set di dati sia per le operazioni di addestramento del modello sia per quelle di backtest.

Per ulteriori informazioni, vedi Quando eseguire la regolazione o l'ereditarietà.

Creare un set di dati AML AI: passaggi 3-4

Derivazione dei dati

La maggior parte dei criteri di governance dei modelli definisce un requisito per monitorare la concatenazione dei dati utilizzata in tutte le operazioni di ML, dalla configurazione del motore, all'addestramento, alla valutazione e alla previsione. I clienti sono responsabili del monitoraggio della struttura di questi dati.

Ti consigliamo di utilizzare un identificatore univoco nei nomi di tutti i dati di input, delle risorse di IA AML e dei dati di output per monitorare la concatenazione nelle varie fasi. In questo modo, puoi assicurarti un collegamento solido tra le risorse in una determinata esecuzione. I clienti possono anche etichettare tutte le risorse di IA AML per soddisfare i requisiti relativi alla sequenza.

Inoltre, ti consigliamo di utilizzare gli snapshot di BigQuery nelle richieste API per garantire la consistenza dei dati.

Questa configurazione consente di rispondere a domande come "da dove proviene questa configurazione dell'engine?" e "da dove proviene questo modello?", nonché di esaminare e risolvere gli incidenti.

Per informazioni dettagliate su come creare e gestire le risorse di IA AML, consulta le pagine sull'API REST.

Creare un set di dati AML AI: passaggi 3-4