Benachrichtigung über Ihre Brennrate

Sie können Benachrichtigungsrichtlinien für Ihre Service Level Objectives (SLOs) erstellen, um darüber informiert zu werden, ob Sie möglicherweise gegen ein SLO verstoßen. Wählen Sie das SLO aus, das Sie überwachen möchten, und konfigurieren Sie dann eine Benachrichtigungsrichtlinie dafür. Die Bedingung wird in der Regel durch die Auswahl eines Schwellenwerts, dessen Überschreiten einen Verstoß darstellt, und eines Zeitraums, für den der Verstoß zulässig ist, ausgedrückt. Wenn der Schwellenwert länger als die zulässige Dauer überschritten wird, wird die Benachrichtigungsrichtlinie ausgelöst.

Auf dieser Seite werden Benachrichtigungen zur Brennrate Ihres Fehlerbudgets erläutert. Die Benachrichtigungsrichtlinien werden dabei nicht im Detail behandelt. Es wird vorausgesetzt, dass Sie die grundlegenden Konzepte zu Bedingungen und Benachrichtigungskanälen kennen.

Allgemeine Informationen zu Benachrichtigungsrichtlinien und deren Erstellung finden Sie unter Einführung in Benachrichtigungen.

Weitere Informationen zum Erstellen einer SLO-basierten Benachrichtigungsrichtlinie finden unter folgenden Themen:

Brennrate des Fehlerbudgets

Ihr Fehlerbudget für einen Compliancezeitraum beträgt (1 - SLO-Ziel) × (mögliche Ereignisse im Compliancezeitraum). Wenn Ihr SLO-Ziel 95 % beträgt, können 5 % der von Ihrem SLI gemessenen Ereignisse fehlschlagen, bevor Ihr SLO-Ziel verfehlt wird.

Die Brennrate gibt an, wie schnell Sie Ihr Fehlerbudget für einen Compliance-Zeitraum verbrauchen. Die Ausschöpfungsrate hängt von der Anzahl der infrage kommenden Ereignisse und der Anzahl der im Compliance-Zeitraum empfangenen Fehlerereignisse ab. Wenn beispielsweise keine Fehlerereignisse auftreten, wird das Fehlerbudget nicht aufgebraucht und die Brennrate ist null. Ein Beispiel dafür, wie Sie die maximale Ausfallzeit für einen Dienst berechnen, indem Sie davon ausgehen, dass alle Anfragen fehlschlagen, finden Sie unter SLO-Durchsatz.

Der Messwert für die Brennrate wird so normalisiert, dass eine Brennrate von mehr als 1 angibt, dass der Dienst bei Einhaltung der gemessenen Fehlerrate über einen zukünftigen Compliancezeitraum in dieser Zeit außerhalb des SLO liegt. Weitere Informationen finden Sie unter Fehlerbudgets.

Der Messwert für die Brennrate wird vom Zeitachsenselektor select_slo_burn_rate abgerufen. Durch eine Benachrichtigungsrichtlinie für die Brennrate werden Sie benachrichtigt, wenn Ihr Fehlerbudget schneller aufgebraucht wird als ein von Ihnen definierter Schwellenwert, gemessen über den Compliancezeitraum der Benachrichtigung. Es gibt noch weitere Zeitachsenselektoren. Weitere Informationen finden Sie unter SLO-Daten abrufen. Sie können Benachrichtigungsrichtlinien erstellen, die einige dieser Zeitachsenselektoren verwenden. Sie müssen diese jedoch mithilfe der Cloud Monitoring API erstellen.

Benachrichtigungsrichtlinie für ein SLO erstellen

Das Erstellen einer Benachrichtigungsrichtlinie für ein SLO entspricht dem Erstellen einer Benachrichtigungsrichtlinie für Messwerte. In diesem Abschnitt werden die allgemeinen Schritte zum Erstellen einer Benachrichtigungsrichtlinie erläutert.

So erstellen Sie eine Benachrichtigungsrichtlinie für ein SLO:

  1. Ermitteln Sie das SLO, auf dem die Benachrichtigungsrichtlinie basieren soll.

  2. Erstellen Sie eine Bedingung für Ihre Benachrichtigungsrichtlinie, die das ausgewählte SLO verwendet. In der Bedingung geben Sie einen Zeitachsenselektor an, der zum Abrufen von SLO-Daten verwendet werden soll. Außerdem geben Sie eine Dauer, einen Schwellenwert und einen Vergleich an, um festzulegen, ab wann das SLO nicht mehr erfüllt wird.

    Wenn Sie beispielsweise den Zeitachsenselektor für die Brennrate verwenden, spiegeln die abgerufenen Daten die Brennrate des Fehlerbudgets für das ausgewählte SLO wider.

    In der Bedingung legen Sie außerdem den Schwellenwert sowie die Dauer des zulässigen Verstoßes gegen das SLO fest, bevor eine Benachrichtigung ausgelöst wird. Beispiel: Sie möchten, dass die Brennrate mit einem bestimmten Wert für einen bestimmten Zeitraum über der gewünschten Rate liegt, bevor eine Warnung ausgelöst wird. Der Wert für "ein Wert über" ist der Schwellenwert der Bedingung und der Wert für "ein bestimmter Zeitraum" ist die Dauer der Bedingung.

  3. Ermitteln oder erstellen Sie einen Benachrichtigungskanal, der in Ihren Benachrichtigungsrichtlinien verwendet werden soll.

  4. Stellen Sie eine Dokumentation bereit, die für die Nutzer erläutert, was die Benachrichtigungsrichtlinie ausgelöst hat.

Allgemeine Informationen zu Benachrichtigungsrichtlinien und deren Erstellung finden Sie unter Einführung in Benachrichtigungen.

Benachrichtigungsrichtlinien und Lookback-Zeiträume

Wenn Sie die SLO-Daten für eine Benachrichtigungsrichtlinie abrufen, müssen Sie eine Kennung für das SLO und einen Lookback-Zeitraum angeben. Der Lookback-Zeitraum bestimmt, wie weit zurückliegende Daten abgerufen werden. Er wird auch als Compliancezeitraum für die Berechnung der SLO-Leistung und des Fehlerbudgets verwendet.

Es ist derzeit nicht möglich, Benachrichtigungen für die Fehlerbudget-Verbrauchsrate eines SLO mit einem Compliancezeitraum von mehr als 24 Stunden zu erstellen. In vielen Fällen reicht es aus, den langfristigen Compliancezeitraum (z. B. 28 oder 30 Tage) auf der Basis eines Zeitraums von weniger als 24 Stunden abzuschätzen, um Ausfälle zu erkennen und um die kurzfristige Reaktion darauf zu ermöglichen.

Kürzere Compliance-Zeiträume ermöglichen eine schnellere Erkennung von Problemen, aber mit der Einschränkung, dass große Änderungen des Traffics und der Fehlerraten im Laufe eines Tages zu sensiblen Benachrichtigungen in Zeiten mit geringem Traffic führen können. Ziehen Sie in Betracht, einen Schwellenwert für die Brennrate zu verwenden, der deutlich größer als 1 ist, um die Warnwahrscheinlichkeit in diesen Zeiten zu verringern.

Arten von Fehlerbudgetbenachrichtigungen

Bei der Einrichtung von Benachrichtigungsrichtlinien zur Beobachtung Ihres Fehlerbudgets empfiehlt es sich, zwei Benachrichtigungsrichtlinien einzurichten:

  • Eine Fast-Burn-Benachrichtigung, die Sie bei einer plötzlichen großen Verbrauchsänderung warnt, die Ihr Fehlerbudget schnell ausschöpft, wenn sie nicht korrigiert wird. "Bei dieser Rate wird das Fehlerbudget des gesamten Monats in zwei Tagen aufgebraucht!"

    Für eine Fast-Burn-Benachrichtigung sollten Sie einen kürzeren Lookback-Zeitraum verwenden, damit Sie schnell benachrichtigt werden, wenn eine potenziell katastrophale Situation Bestand hatte, auch wenn dies nur für kurze Zeit der Fall war. Wenn die Lage tatsächlich katastrophal ist, möchten Sie das natürlich so schnell wie möglich wissen.

    Der Schwellenwert für eine Benachrichtigung über die Verbrauchsrate ist hierbei deutlich höher als der gewünschte Basiswert für den Lookback-Zeitraum.

  • Eine Slow-Burn-Benachrichtigung, die Sie vor einer Verbrauchsrate warnt, die Ihr Fehlerbudget vor Ablauf des Compliance-Zeitraums ausschöpft, falls sie nicht geändert wird. Dieser Bedingungstyp ist weniger dringend als eine Fast-Burn-Bedingung. "Wir sind leicht über dem Punkt, an dem wir zu diesem Zeitpunkt des Monats sein möchten, aber wir sind noch nicht in großen Schwierigkeiten."

    Für eine Slow-Burn-Benachrichtigung verwenden Sie eine längere Lookback-Dauer, um Schwankungen im kurzfristigen Verbrauch auszugleichen.

    Der Schwellenwert für eine Slow-Burn-Benachrichtigung ist höher als die ideale Leistung für den Lookback-Zeitraum, wenn auch nicht wesentlich höher. Wenn der Verbrauch sich langfristig ausgleicht, würde eine Richtlinie, die auf einem kürzeren Lookback-Zeitraum mit einem hohen Schwellenwert beruht, unter Umständen trotzdem zu vielen unnötigen Benachrichtigungen führen. Wenn der Verbrauch jedoch über einen längeren Zeitraum auch nur etwas zu hoch ist, würde er letztendlich Ihr gesamtes Fehlerbudget verbrauchen.

Nächste Schritte