Anomalieerkennung – Übersicht
Die Anomalieerkennung ist ein Data Mining-Verfahren, mit dem Sie Datenabweichungen in einem bestimmten Dataset identifizieren können. Wenn die Rückgabequote eines bestimmten Produkts beispielsweise im Vergleich zur Baseline für dieses Produkt erheblich steigt, kann dies auf einen Produktfehler oder einen potenziellen Betrug hindeuten. Mit der Anomalieerkennung können Sie kritische Vorfälle wie technische Probleme oder Chancen wie Änderungen des Verbraucherverhaltens erkennen.
Eine Herausforderung bei der Anomalieerkennung besteht darin, zu bestimmen, was als anomale Daten zählt. Wenn Sie Daten mit Labels versehen haben, die Anomalien identifizieren, können Sie die Anomalieerkennung mit einem der folgenden überwachten ML-Modelle durchführen:
- Lineare und logistische Regressionsmodelle
- Boosted Tree-Modelle
- Random Forest-Modelle
- DNNs und Wide & Deep-Modelle
- AutoML-Modelle
Wenn Sie sich nicht sicher sind, was als anomale Daten zählt, oder Sie keine Daten mit Labels zum Trainieren eines Modells haben, können Sie unbeaufsichtigtes maschinelles Lernen zur Anomalieerkennung verwenden. Verwenden Sie die Funktion ML.DETECT_ANOMALIES
mit einem der folgenden Modelle, um Anomalien in Trainingsdaten oder neuen Bereitstellungsdaten zu erkennen:
Datentyp | Modelltypen | Aufgabe von ML.DETECT_ANOMALIES |
---|---|---|
Zeitreihe | ARIMA_PLUS
|
Anomalien in der Zeitreihe erkennen. |
ARIMA_PLUS_XREG
|
Anomalien in der Zeitreihe mit externen Regressoren erkennen. | |
Unabhängige und identisch verteilte Zufallsvariablen (IID) | K-means | Anomalien auf der Grundlage der kürzesten Entfernung bei den normalisierten Entfernungen von den Eingabedaten zu jedem Clusterschwerpunkt erkennen. Eine Definition der normalisierten Entfernungen finden Sie unter k-Means-Modellausgabe für die Funktion ML.DETECT_ANOMALIES . |
Autoencoder | Anomalien aufgrund des Rekonstruktionsverlusts in Bezug auf den mittleren quadratischen Fehler erkennen. Weitere Informationen finden Sie unter ML.RECONSTRUCTION_LOSS . Mit der Funktion ML.RECONSTRUCTION_LOSS können alle Arten von Rekonstruktionsverlust abgerufen werden. |
|
PCA | Anomalien anhand des Rekonstruktionsverlusts in Bezug auf den mittleren quadratischen Fehler erkennen. |