Genera un modello

Questa pagina tratta brevemente i concetti alla base dell'addestramento dei modelli.

Quando eseguire un addestramento o un nuovo addestramento

AML AI addestra un modello durante la creazione di una risorsa del modello. Il modello deve essere addestrato prima di poter essere valutato (ovvero sottoposto a test backtest) o utilizzato per generare risultati della previsione.

Per ottenere prestazioni ottimali e per mantenere i modelli più aggiornati, valuta la possibilità di eseguire un riaddestramento mensile. Tuttavia, una determinata versione del motore supporta la generazione di risultati di previsione per 12 mesi dal rilascio di una versione secondaria più recente del motore.

Come eseguire l'addestramento

Per addestrare un modello, ovvero creare un modello, consulta Creazione e gestione dei modelli.

In particolare, devi selezionare quanto segue:

  • Dati da utilizzare per l'addestramento:

    Specifica un set di dati e un'ora di fine nell'intervallo di date del set di dati.

    L'addestramento utilizza etichette e funzionalità basate sui mesi di calendario completi fino al mese dell'ora di fine selezionata, escluso il mese. Per ulteriori informazioni, consulta Intervalli di tempo dei set di dati.

  • Una configurazione motore creata utilizzando un set di dati coerente:

    Vedi Configurare un motore.

Output formazione

L'addestramento genera una risorsa del modello, che può essere utilizzata per:

  • Creare risultati del backtest, che vengono utilizzati per valutare le prestazioni del modello usando veri positivi attualmente noti
  • Crea risultati di previsione, che vengono usati quando è tutto pronto per iniziare a esaminare nuovi casi di potenziale riciclaggio di denaro

I metadati del modello contengono la seguente metrica. In particolare, questa metrica mostra eventuali modifiche significative relative alle famiglie di caratteristiche supportate dal set di dati (tra ottimizzazione dei motori, addestramento, valutazione e previsione).

Nome metrica Descrizione della metrica Esempio di valore metrica
Mancanza

Quota dei valori mancanti in tutte le funzionalità in ogni famiglia di caratteristiche.

Idealmente, tutte le famiglie di funzionalità AML AI dovrebbero avere un'assenza vicina a 0. Potrebbero verificarsi eccezioni quando i dati sottostanti a queste famiglie di funzionalità non sono disponibili per l'integrazione.

Un cambiamento significativo in questo valore per qualsiasi famiglia di caratteristiche tra ottimizzazione, addestramento, valutazione e previsione può indicare incoerenze nei set di dati utilizzati.


{
  "featureFamilies": [
    {
      "featureFamily": "unusual_wire_credit_activity",
      "missingnessValue": 0.00,
    },
    ...
    ...
    {
      "featureFamily": "party_supplementary_data_id_3",
      "missingnessValue": 0.45,
    },
  ],
}
Importanza

Una metrica che mostra l'importanza di una famiglia di caratteristiche per il modello. Valori più alti indicano un uso più significativo della famiglia di caratteristiche nel modello. Una famiglia di caratteristiche che non viene utilizzata nel modello ha importanza zero.

I valori di importanza possono essere utilizzati per dare priorità ai risultati relativi al disallineamento della famiglia. Ad esempio, lo stesso valore di disallineamento per una famiglia che ha un'importanza maggiore per il modello è più urgente da risolvere.


{
  "featureFamilies": [
    {
      "featureFamily": "unusual_wire_credit_activity",
      "importanceValue": 459761000000,
    },
    ...
    ...
    {
      "featureFamily": "party_supplementary_data_id_3",
      "importanceValue": 27492,
    },
  ],
}

I metadati del modello non contengono metriche di richiamo da un set di test. Per generare misurazioni del richiamo per un periodo di tempo specifico, ad esempio il set di test, consulta Valutare un modello.