Informationen zur Anomalieerkennung

Diese Seite gilt für Apigee und Apigee Hybrid.

Apigee Edge-Dokumentation aufrufen

Was ist eine Anomalie?

Eine Anomalie ist ein ungewöhnliches oder unerwartetes API-Datenmuster. Sehen Sie sich beispielsweise die Grafik der API-Fehlerrate unten an:

Grafik einer Anomalie mit einer Fehlerrate

Wie Sie sehen, steigt die Fehlerrate plötzlich um 07:00 Uhr an. Im Vergleich zu den Daten bis zu diesem Zeitpunkt ist diese Steigerung ungewöhnlich genug, um als Anomalie eingestuft zu werden.

Allerdings sind nicht alle Abweichungen in API-Daten Anomalien. Die meisten sind einfach zufällige Schwankungen. Sie können beispielsweise einige geringfügige Schwankungen der Fehlerrate vor der Anomalie erkennen, diese sind jedoch nicht groß genug, um sie als wahre Anomalie zu bezeichnen.

Anomalie oder zufälllige Datenabweichungen.

AAPI Ops überwacht API-Daten kontinuierlich und führt statistische Analysen durch, um echte Anomalien von zufälligen Schwankungen in den Daten zu unterscheiden.

Ohne Anomalieerkennung müssen Sie einen Schwellenwert für die Erkennung von Anomalien auswählen. Ein Schwellenwert ist ein Wert, den eine Menge, z. B. die Fehlerrate, erreichen muss, um eine Anomalie auszulösen. Außerdem müssen Sie die Schwellenwerte basierend auf den aktuellsten Daten auf dem neuesten Stand halten. Im Gegensatz dazu wählt AAPI-Ops anhand der aktuellen Datenmuster die besten Anomalien für Sie aus.

Wenn AAPI eine Anomalie wie die oben gezeigte entdeckt, werden im Anomalien-Dashboard weitere Details zu Anomalien angezeigt. An diesem Punkt können Sie die Anomalie in den API Monitoring-Dashboards untersuchen und gegebenenfalls entsprechende Maßnahmen ergreifen. Außerdem haben Sie die Möglichkeit, eine Benachrichtigung zu erstellen, um bei zukünftigen Anomalieereignissen informiert zu werden.

Eine erkannte Anomalie enthält folgende Informationen:

  • Den Messwert, der die Anomalie verursacht hat, z. B. Proxy-Latenz oder einen HTTP-Fehlercode.
  • Den Schweregrad der Anomalie. Je nach Konfidenzgrad im Modell kann der Schweregrad leicht, moderat oder gravierend sein. Ein niedriger Konfidenzwert verweist auf einen leichten Schweregrad, ein hoher Konfidenzwert hingegen auf einen gravierenden Schweregrad.

Anomalietypen

Apigee erkennt automatisch folgende Anomaliearten:

  • Zunahme von HTTP 503-Fehlern auf Organisations-, Umgebungs- und Regionsebene
  • Zunahme von HTTP 504-Fehlern auf Organisations-, Umgebungs- und Regionsebene
  • Zunahme aller HTTP 4xx- oder 5xx-Fehler auf Organisations-, Umgebungs- und Regionsebene
  • Zunahme der Gesamtantwortlatenz für das 90. Perzentil (p90) auf Organisations-, Umgebungs- und Regionsebene

Funktionsweise der Anomalieerkennung

Die Anomalieerkennung umfasst die folgenden Phasen:

Modelle trainieren

Bei der Anomalieerkennung wird ein Modell des Verhaltens Ihrer API-Proxys aus historischen Verlaufsdaten der Zeitachse trainiert. Sie müssen nichts weiter tun, um das Modell zu trainieren. Apigee erstellt und trainiert automatisch Modelle aus den API-Daten der letzten sechs Stunden. Daher benötigt Apigee mindestens sechs Stunden an Daten für einen API-Proxy, um das Modell zu trainieren, bevor eine Anomalie protokolliert werden kann.

Das Ziel des Trainings besteht darin, die Genauigkeit des Modells zu verbessern, das dann an Verlaufsdaten getestet werden kann. Die Genauigkeit eines Modells lässt sich am einfachsten mit der Fehlerrate (der Summe von falsch positiven und falsch negativen Ergebnissen) geteilt durch die Gesamtzahl der vorhergesagten Ereignisse messen.

Anomalieereignisse loggen

Während der Laufzeit vergleicht die Apigee-Anomalieerkennung das aktuelle Verhalten Ihrer API-Proxys mit dem vom Modell vorhergesagten Verhalten. Mit der Anomalieerkennung kann dann ein bestimmter Konfidenzwert festgelegt werden, wenn ein Betriebswert den vorhergesagten Wert überschreitet. Das gilt zum Beispiel, wenn die Rate von 5xx-Fehlern die vom Modell vorhergesagte Rate überschreitet.

Wenn Apigee eine Anomalie erkennt, wird das Ereignis automatisch im Anomalien-Dashboard protokolliert. Die im Dashboard angezeigte Liste der Ereignisse enthält alle erkannten Anomalien sowie ausgelöste Benachrichtigungen.