Anomalieerkennung – Übersicht

Die Anomalieerkennung ist ein Data Mining-Verfahren, mit dem Sie Datenabweichungen in einem bestimmten Dataset identifizieren können. Wenn die Rückgabequote eines bestimmten Produkts beispielsweise im Vergleich zur Baseline für dieses Produkt erheblich steigt, kann dies auf einen Produktfehler oder einen potenziellen Betrug hindeuten. Mit der Anomalieerkennung können Sie kritische Vorfälle wie technische Probleme oder Chancen wie Änderungen des Verbraucherverhaltens erkennen.

Eine Herausforderung bei der Anomalieerkennung besteht darin, zu bestimmen, was als anomale Daten zählt. Wenn Sie Daten mit Labels versehen haben, die Anomalien identifizieren, können Sie die Anomalieerkennung mit einem der folgenden überwachten ML-Modelle durchführen:

  • Lineare und logistische Regressionsmodelle
  • Boosted Tree-Modelle
  • Random Forest-Modelle
  • DNNs und Wide & Deep-Modelle
  • AutoML-Modelle

Wenn Sie sich nicht sicher sind, was als anomale Daten zählt, oder Sie keine Daten mit Labels zum Trainieren eines Modells haben, können Sie unbeaufsichtigtes maschinelles Lernen zur Anomalieerkennung verwenden. Verwenden Sie die Funktion ML.DETECT_ANOMALIES mit einem der folgenden Modelle, um Anomalien in Trainingsdaten oder neuen Bereitstellungsdaten zu erkennen:

Datentyp Modelltypen Aufgabe von ML.DETECT_ANOMALIES
Zeitreihe ARIMA_PLUS Anomalien in der Zeitreihe erkennen.
ARIMA_PLUS_XREG Anomalien in der Zeitreihe mit externen Regressoren erkennen.
Unabhängige und identisch verteilte Zufallsvariablen (IID) K-means Anomalien auf der Grundlage der kürzesten Entfernung bei den normalisierten Entfernungen von den Eingabedaten zu jedem Clusterschwerpunkt erkennen. Eine Definition der normalisierten Entfernungen finden Sie unter k-Means-Modellausgabe für die Funktion ML.DETECT_ANOMALIES.
Autoencoder Anomalien aufgrund des Rekonstruktionsverlusts in Bezug auf den mittleren quadratischen Fehler erkennen. Weitere Informationen finden Sie unter ML.RECONSTRUCTION_LOSS. Mit der Funktion ML.RECONSTRUCTION_LOSS können alle Arten von Rekonstruktionsverlust abgerufen werden.
PCA Anomalien anhand des Rekonstruktionsverlusts in Bezug auf den mittleren quadratischen Fehler erkennen.