Anomalieerkennung – Übersicht
Die Anomalieerkennung ist ein Data-Mining-Verfahren, mit dem Sie Datenabweichungen in einem bestimmten Datensatz ermitteln können. Wenn sich die Rücksenderate für ein bestimmtes Produkt beispielsweise deutlich über dem Normalwert für dieses Produkt erhöht, kann das auf einen Produktfehler oder potenziellen Betrug hinweisen. Mithilfe der Anomalieerkennung können Sie kritische Vorfälle wie technische Probleme oder Chancen wie Änderungen des Verbraucherverhaltens erkennen.
Eine Herausforderung bei der Anomalieerkennung besteht darin, zu bestimmen, was als anormale Daten gilt. Wenn Sie Daten mit Labels haben, anhand derer Anomalien identifiziert werden, können Sie die Anomalieerkennung mit der Funktion ML.PREDICT
und einem der folgenden beaufsichtigten Modelle für maschinelles Lernen durchführen:
- Lineare und logistische Regressionsmodelle
- Boosted Tree-Modelle
- Random Forest-Modelle
- Modelle mit neuronalem Deep-Learning-Netzwerk (DNN)
- Wide-and-Deep-Netzwerkmodelle
- AutoML-Modelle
Wenn Sie sich nicht sicher sind, was als anormale Daten gilt, oder keine mit Labels versehenen Daten zum Trainieren eines Modells haben, können Sie die Anomalieerkennung mit unbeaufsichtigtem maschinellem Lernen durchführen. Verwenden Sie die ML.DETECT_ANOMALIES
-Funktion mit einem der folgenden Modelle, um Anomalien in Trainingsdaten oder neuen Auslieferungsdaten zu erkennen:
Datentyp | Modelltypen | Aufgabe von ML.DETECT_ANOMALIES |
---|---|---|
Zeitreihe | ARIMA_PLUS
|
Anomalien in der Zeitreihe erkennen. |
ARIMA_PLUS_XREG
|
Erkennen Sie Anomalien in der Zeitreihe mit externen Regressoren. | |
Unabhängige und identisch verteilte Zufallsvariablen (IID) | K-means | Anomalien auf der Grundlage der kürzesten Entfernung bei den normalisierten Entfernungen von den Eingabedaten zu jedem Clusterschwerpunkt erkennen. Eine Definition der normalisierten Entfernungen finden Sie in der K-Means-Modellausgabe für die Funktion ML.DETECT_ANOMALIES . |
Autoencoder | Anomalien aufgrund des Rekonstruktionsverlusts in Bezug auf den mittleren quadratischen Fehler erkennen. Weitere Informationen finden Sie unter ML.RECONSTRUCTION_LOSS . Die Funktion ML.RECONSTRUCTION_LOSS kann
alle Arten von Rekonstruktionsverlusten abrufen. |
|
PCA | Anomalien anhand des Rekonstruktionsverlusts in Bezug auf den mittleren quadratischen Fehler erkennen. |