Service Level Objectives –Übersicht
Service Level Objectives (SLOs) sind ein wichtiges Tool im Monitoring-Toolkit von Google-Diensten. SLOs können Ihnen einen präzisen Indikator zum Gesamtzustand Ihrer Dienste liefern. Mit Anthos Service Mesh können Sie SLOs für Ihre Dienste festlegen und Ihre Dienste in Bezug auf diese SLOs im Blick behalten und entsprechende Benachrichtigungen einrichten.
Um den Status eines Dienstes zu überwachen, müssen Sie wissen, welches Verhalten für diesen Dienst wichtig ist und wie Sie dieses Verhalten messen und auswerten können. Ein Service Level Indicator (SLI) ist ein quantitatives Maß für einen Aspekt des Dienstes. Typische SLIs sind:
- Latenz: Wie lange es dauert, um eine Antwort auf eine Anfrage zurückzugeben, was normalerweise in Millisekunden (ms) gemessen wird. Die Latenz wird normalerweise als Zusammenfassung dargestellt. Das heißt, die Rohdaten werden für einen bestimmten Zeitraum erfasst und als Perzentile berechnet. Anthos Service Mesh zeigt auf der Seite Messwerte für jeden Ihrer Dienste ein Latenzdiagramm an. Das Latenzdiagramm zeigt die Latenz im Zeitverlauf, sodass Sie für einen Dienst einen Latenzschwellenwert oder eine Obergrenze ermitteln können.
- Verfügbarkeit: Die Zeit, in der ein Dienst erfolgreich reagiert. Dies wird normalerweise als das Verhältnis der Anzahl erfolgreicher Antworten zur Gesamtzahl der Antworten ausgedrückt. Anhand der Fehlerratengrafik auf der Seite Messwerte können Sie die Verfügbarkeit jedes einzelnen Dienstes ermitteln.
Ein SLO ist ein Zielwert für ein Service Level, das von einem SLI gemessen wird. Ein SLO kann so dargestellt werden: SLI ≤ upper_bound
oder SLI ≥ lower_bound
. SLOs sind messbare Ziele für die Leistung in einem bestimmten Zeitraum. Für manche Ihrer Dienste müssen vielleicht folgende Anforderungen erfüllt sein:
- Die Latenz darf über einen rollierenden Zeitraum von 30 Tagen nur bei 5 % der Anfragen eine Latenz von 300 ms überschreiten.
- Das System muss über eine Kalenderwoche eine Verfügbarkeit von 99 % haben.
Auf der Seite Status können Sie SLOs für Ihre Dienste auf der Grundlage ihrer Telemetriedaten festlegen und ansehen. Sie können dann in Cloud Monitoring Benachrichtigungen erstellen, um zu warnen, wenn ein Dienst nicht wie erwartet funktioniert.
Nächste Schritte
Weitere Informationen zu Site Reliability Engineering-SLOs bei Google: