Questa pagina illustra brevemente i concetti alla base dell'addestramento del modello. Un'IA di AML rappresenta un modello addestrato che può essere utilizzato per generare rischi punteggi e spiegabilità.
Quando eseguire l'addestramento o il nuovo addestramento
AML AI addestra un modello durante la creazione Risorsa modello. Il modello deve essere addestrato prima di poter essere valutato (ovvero sottoposto a backtest) o utilizzato per generare risultati di previsione.
Per ottenere le migliori prestazioni e mantenere i modelli più aggiornati, valuta la possibilità di eseguire un nuovo addestramento mensile. Tuttavia, una determinata versione del motore supporta la generazione di risultati di previsione per 12 mesi dalla release di una versione secondaria più recente del motore.
Come eseguire l'addestramento
Per addestrare un modello (ovvero crearne uno), consulta Creare e gestire i modelli.
In particolare, devi selezionare quanto segue:
I dati da utilizzare per l'addestramento:
Specifica un set di dati e un'ora di fine nell'intervallo di date del set di dati.
L'addestramento utilizza etichette e funzionalità basate su mesi solari completi fino al mese dell'ora di fine selezionata, escluso. Per ulteriori informazioni, consulta Intervalli di tempo dei set di dati.
Una configurazione del motore creata utilizzando un set di dati coerente:
Vedi Configurare un motore.
Output formazione
L'addestramento genera Risorsa modello, che può essere utilizzato per:
- Creare risultati di backtest, che vengono utilizzati per valutare le prestazioni del modello utilizzando i veri positivi attualmente noti
- Creare risultati di previsione, che vengono utilizzati quando è tutto pronto per iniziare a esaminare nuove segnalazioni di potenziale riciclaggio di denaro
I
metadati del modello
contengono la metrica missingness
, che può essere utilizzata per valutare la
coerenza del set di dati
(ad esempio, confrontando i valori di mancanza delle famiglie di funzionalità di
diverse operazioni)
Nome metrica | Descrizione della metrica | Valore della metrica di esempio |
---|---|---|
Mancanza di dati |
Quota di valori mancanti in tutte le caratteristiche in ciascuna famiglia di caratteristiche. Idealmente, tutte le famiglie di funzionalità di IA AML dovrebbero avere un valore di mancante prossimo a 0. Potrebbero verificarsi eccezioni se i dati alla base di queste famiglie di funzionalità non sono disponibili per l'integrazione. Un cambiamento significativo in questo valore per qualsiasi famiglia di caratteristiche tra ottimizzazione, l'addestramento, la valutazione e la previsione possono indicare e i set di dati utilizzati. |
{ "featureFamilies": [ { "featureFamily": "unusual_wire_credit_activity", "missingnessValue": 0.00, }, ... ... { "featureFamily": "party_supplementary_data_id_3", "missingnessValue": 0.45, }, ], } |
Importanza |
Una metrica che mostra l'importanza di una famiglia di funzionalità per il modello. Valori più alti indicano un utilizzo più significativo della famiglia di funzionalità nel modello. Una famiglia di caratteristiche non utilizzata nel modello ha importanza pari a zero. I valori di importanza possono essere utilizzati quando si dà la priorità all'azione in base ai risultati di disallineamento famigliare. Ad esempio, è più urgente risolvere lo stesso valore di disallineamento per una famiglia con un'importanza maggiore per il modello. |
{ "featureFamilies": [ { "featureFamily": "unusual_wire_credit_activity", "importanceValue": 459761000000, }, ... ... { "featureFamily": "party_supplementary_data_id_3", "importanceValue": 27492, }, ], } |
I metadati del modello non contengono metriche di richiamo di un set di test. Per generare misurazioni del recupero per un periodo di tempo specifico (ad esempio il set di test), consulta Valutare un modello.