Panoramica del rilevamento di anomalie

Il rilevamento di anomalie è una tecnica di data mining che puoi utilizzare per identificare le deviazioni dei dati in un determinato set di dati. Ad esempio, se il tasso di resi per un determinato prodotto aumenta notevolmente rispetto alla base di riferimento per quel prodotto, ciò potrebbe indicare un difetto del prodotto o una potenziale frode. Puoi utilizzare il rilevamento di anomalie per rilevare incidenti critici, ad esempio problemi tecnici oppure opportunità, come cambiamenti nel comportamento dei consumatori.

Una sfida quando utilizzi il rilevamento di anomalie è determinare quali dati vengono conteggiati come anomali. Se hai etichettato dati che identificano anomalie, puoi eseguire il rilevamento di anomalie con uno dei seguenti modelli di machine learning supervisionato:

  • Modelli di regressione lineare e logistica
  • Modelli Boosted Tree
  • Modelli di foreste casuali
  • DNN e modelli Wide & Deep
  • Modelli AutoML

Se non sai con certezza quali dati vengono conteggiati come anomali o se non disponi di dati etichettati su cui addestrare un modello, puoi utilizzare il machine learning non supervisionato per rilevare eventuali anomalie. Utilizza la funzione ML.DETECT_ANOMALIES con uno dei seguenti modelli per rilevare anomalie nei dati di addestramento o nuovi dati di pubblicazione:

Tipo di dati Tipi di modello Che cosa fa ML.DETECT_ANOMALIES
Serie temporale ARIMA_PLUS Rileva le anomalie nelle serie temporali.
ARIMA_PLUS_XREG Rilevare le anomalie nelle serie temporali con regressori esterni.
Variabili casuali indipendenti e distribuite in modo identico (IID) K-means Rileva le anomalie in base alla distanza più breve tra le distanze normalizzate dai dati di input a ciascun centroide del cluster. Per una definizione delle distanze normalizzate, consulta L'output del modello k-means per la funzione ML.DETECT_ANOMALIES.
Codificatore automatico Rileva le anomalie in base alla perdita di ricostruzione in termini di errore quadratico medio. Per ulteriori informazioni, vedi ML.RECONSTRUCTION_LOSS. La funzione ML.RECONSTRUCTION_LOSS può recuperare tutti i tipi di perdita da ricostruzione.
APC Rileva le anomalie in base alla perdita della ricostruzione in termini di errore quadratico medio.