Panoramica del rilevamento di anomalie

Il rilevamento delle anomalie è una tecnica di data mining che puoi utilizzare per identificare le deviazioni dei dati in un determinato set di dati. Ad esempio, se il tasso di reso di un determinato prodotto aumenta notevolmente rispetto al valore di riferimento, potrebbe indicare un difetto del prodotto o una potenziale attività fraudolenta. Puoi utilizzare il rilevamento delle anomalie per rilevare incidenti critici, come problemi tecnici, o opportunità, come cambiamenti nel comportamento dei consumatori.

Un problema che si verifica quando utilizzi il rilevamento delle anomalie è determinare cosa viene considerato come dato anomalo. Se disponi di dati etichettati che identificano anomalie, puoi eseguire il rilevamento di anomalie utilizzando la funzione ML.PREDICT con uno dei seguenti modelli di machine learning supervisionato:

Se non sai con certezza quali dati sono considerati anomali o se non hai dati etichettati su cui addestrare un modello, puoi utilizzare il machine learning non supervisionato per eseguire il rilevamento delle anomalie. Utilizza la funzione ML.DETECT_ANOMALIES con uno dei seguenti modelli per rilevare anomalie nei dati di addestramento o nei nuovi dati di pubblicazione:

Tipo di dati Tipi di modello Che cosa fa ML.DETECT_ANOMALIES
Serie temporale ARIMA_PLUS Rileva le anomalie nelle serie temporali.
ARIMA_PLUS_XREG Rileva le anomalie nelle serie temporali con regressori esterni.
Variabili casuali indipendenti e con distribuzione identica (IID) K-means Rileva le anomalie in base alla distanza più breve tra le distanze normalizzate dai dati di input a ciascun centroide del cluster. Per una definizione delle distanze normalizzate, consulta l'output del modello k-means per la funzione ML.DETECT_ANOMALIES.
Autoencoder Rileva le anomalie in base alla perdita di ricostruzione in termini di errore quadratico medio. Per ulteriori informazioni, vedi ML.RECONSTRUCTION_LOSS. La funzione ML.RECONSTRUCTION_LOSS può recuperare tutti i tipi di perdita di ricostruzione.
PCA Rileva le anomalie in base alla perdita di ricostruzione in termini di errore quadratico medio.

Utilizzando le impostazioni predefinite nelle istruzioni CREATE MODEL e nelle funzioni di inferenza, puoi creare e utilizzare un modello di rilevamento delle anomalie anche senza molte conoscenze di ML. Tuttavia, avere conoscenze di base sullo sviluppo del ML ti aiuta a ottimizzare sia i dati sia il modello per ottenere risultati migliori. Ti consigliamo di utilizzare le seguenti risorse per acquisire familiarità con le tecniche e le procedure di ML: