Vorfälle für messwertbasierte Benachrichtigungsrichtlinien

Ein Vorfall ist ein Datensatz, der angibt, wann eine oder mehrere Bedingungen einer Benachrichtigungsrichtlinie erfüllt sind. Wenn die Bedingungen erfüllt sind, erstellt Cloud Monitoring in der Regel einen Vorfall und sendet eine Benachrichtigung. Es werden jedoch keine Vorfälle erstellt, wenn die Richtlinie zurückgestellt oder deaktiviert ist, wenn zu viele offene Vorfälle für diese Richtlinie vorliegen oder wenn bekannt ist, dass die zugrunde liegende Ressource deaktiviert ist. Wenn eine Benachrichtigungsrichtlinie mehrere Bedingungen enthält, gibt die Benachrichtigungsrichtlinie außerdem an, ob das Erfüllen einer Bedingung ausreicht, um einen Vorfall zu erstellen.

In diesem Dokument wird beschrieben, wie Sie Vorfälle für messwertbasierte Benachrichtigungsrichtlinien ansehen, untersuchen und verwalten können.

Hinweise

Prüfen Sie, ob Sie die erforderlichen Berechtigungen haben:

Weitere Informationen zu Cloud Monitoring-Rollen finden Sie unter Zugriff mit Identity and Access Management steuern.

Vorfälle suchen

So rufen Sie eine Liste der Vorfälle auf:

  1. Rufen Sie in der Google Cloud Console die Seite  Benachrichtigungen auf:

    Zu Benachrichtigungen

    Wenn Sie diese Seite über die Suchleiste suchen, wählen Sie das Ergebnis aus, dessen Zwischenüberschrift Monitoring ist.

    • Im Bereich Zusammenfassung wird die Anzahl der offenen Vorfälle angezeigt.
    • Im Bereich Vorfälle werden die zuletzt geöffneten Vorfälle angezeigt. Klicken Sie auf Geschlossene Vorfälle anzeigen, um die neuesten Vorfälle einschließlich geschlossener Vorfälle in der Tabelle aufzulisten.
  2. Optional: Wenn Sie die Details eines bestimmten Vorfalls ansehen möchten, wählen Sie den Vorfall in der Liste aus. Die Seite Vorfalldetails wird geöffnet. Informationen zu dieser Seite finden Sie im Abschnitt Vorfälle untersuchen.

Ältere Vorfälle suchen

Im Bereich Vorfälle auf der Seite Benachrichtigungen werden die jüngsten offenen Vorfälle angezeigt. Führen Sie einen der folgenden Schritte aus, um nach älteren Vorfällen zu suchen:

  • Klicken Sie auf  Neuer oder  Älter, um die Einträge in der Tabelle Vorfälle durch zu gehen.

  • Klicken Sie auf Alle Vorfälle ansehen, um die Seite Vorfälle aufzurufen. Auf der Seite Vorfälle haben Sie folgende Möglichkeiten:

    • Geschlossene Vorfälle anzeigen: Klicken Sie zum Auflisten aller Vorfälle in der Tabelle auf ShowClosed Vorfälles (Geschlossene Vorfälle anzeigen).
    • Filtervorfälle: Informationen zum Hinzufügen von Filtern finden Sie unter Vorfälle filtern.
    • Bestätigen oder schließen Sie einen Vorfall oder pausieren Sie die zugehörige Benachrichtigungsrichtlinie. Sie können auf diese Optionen zugreifen, indem Sie in der Zeile des Vorfalls auf  Weitere Optionen klicken und eine Auswahl im Menü treffen. Weitere Informationen finden Sie unter Vorfälle verwalten.

Vorfälle filtern

Wenn Sie einen Wert in die Filterleiste eingeben, werden nur Vorfälle aus der Tabelle Vorfälle aufgelistet, die dem Filter entsprechen. Wenn Sie mehrere Filter hinzufügen, wird ein Vorfall nur dann angezeigt, wenn er alle Filter erfüllt.

So fügen Sie einer Tabelle mit Vorfällen einen Filter hinzu:

  1. Klicken Sie auf der Seite Vorfälle auf  Tabelle filtern und wählen Sie ein Filterattribut. Filtereigenschaften umfassen Folgendes:

    • Zustand des Vorfalls
    • Name der Benachrichtigungsrichtlinie
    • Wann der Vorfall geöffnet oder geschlossen wurde
    • Messwerttyp
    • Ressourcentyp
  2. Wählen Sie einen Wert aus dem sekundären Menü oder geben Sie einen Wert in die Filterleiste ein.

    Wenn Sie beispielsweise Messwerttyp auswählen und usage_time eingeben, werden möglicherweise nur die folgenden Optionen im sekundären Menü angezeigt:

    agent.googleapis.com/cpu/usage_time
    compute.googleapis.com/guest/container/cpu/usage_time
    container.googleapis.com/container/cpu/usage_time
    

Vorfälle untersuchen

Wenn Sie den Vorfall gefunden haben, den Sie untersuchen möchten, rufen Sie die Seite Vorfalldetails für diesen Vorfall auf. Wählen Sie in der Tabelle der Vorfälle auf der Seite Benachrichtigungen oder auf der Seite Vorfälle die Vorfallzusammenfassung aus, um die Details aufzurufen.

Wenn Sie alternativ eine Benachrichtigung mit einem Link zu dem Vorfall erhalten haben, können Sie über diesen Link die Vorfalldetails aufrufen.

Auf der Seite Details zu Vorfällen finden Sie folgende Informationen:

  • Statusinformationen wie:

    • Name: Der Name der Benachrichtigungsrichtlinie, die diesen Vorfall verursacht hat.
    • Status: Der Status des Vorfalls: offen, bestätigt oder geschlossen.
    • Schweregrad: Der Schweregrad des Vorfalls:
      • Kein Schweregrad
      • Kritisch
      • Fehler
      • Warnung
    • Dauer: Der Zeitraum, in dem der Vorfall geöffnet war.
  • Informationen zu der Benachrichtigungsrichtlinie, die den Vorfall ausgelöst hat:

    • Bereich Bedingung: Gibt in der Benachrichtigungsrichtlinie die Bedingung an, die den Vorfall verursacht hat.

    • Bereich Nachricht: enthält eine kurze Erklärung der Ursache basierend auf der Konfiguration der Bedingung in der Benachrichtigungsrichtlinie. Dieser Bereich wird immer ausgefüllt.

    • Bereich Dokumentation: Hier wird die Dokumentationsvorlage für Benachrichtigungen angezeigt, die Sie beim Erstellen der Benachrichtigungsrichtlinie angegeben haben. Diese Informationen können eine Beschreibung dessen enthalten, was die Benachrichtigungsrichtlinie überwacht, sowie Tipps zur Abhilfe.

      Wenn Sie dieses Feld beim Erstellen der Benachrichtigungsrichtlinie übersprungen haben, wird in diesem Bereich die Meldung „Keine Dokumentation wurde konfiguriert“ angezeigt.

  • Labels: enthält Folgendes:
    • Die Labels und Werte für die überwachte Ressource und den Messwert der Zeitachse, die den Vorfall verursacht hat. Mithilfe dieser Informationen können Sie die spezifische überwachte Ressource identifizieren, die den Vorfall verursacht hat.

      Wenn Sie in der Dokumentation Variablen für Messwertlabels verwenden, lässt Monitoring das Label in Benachrichtigungen aus, wenn der Labelwert nicht mit einer Ziffer, einem Buchstaben, einem Schrägstrich (/) oder einem Gleichheitszeichen (=) beginnt.

    • Alle benutzerdefinierten Labels und Werte, die Sie in der Benachrichtigungsrichtlinie definiert haben. Sie können diese Labels zum Organisieren und Identifizieren von Benachrichtigungsrichtlinien verwenden. Mit einer Richtlinie verknüpfte Labels werden im Bereich Richtlinienlabels aufgeführt, während Labels, die als Teil einer Bedingung definiert sind, im Bereich Messwertlabels aufgeführt werden. Metadatenlabels werden nur angezeigt, wenn es einen Filter oder eine Gruppierung gibt, die vom Label abhängig ist. Weitere Informationen finden Sie unter Benachrichtigungen mit Labels versehen.

Auf der Seite Vorfalldetails finden Sie außerdem Tools zur Untersuchung des Vorfalls:

  • Vorfallzeitachse: Zeigt zwei visuelle Darstellungen des Vorfalls an:

    • Auf der Zeitachse stellt ein roter Balken die Zeit eines Vorfalls dar. Länge und Position des Balkens spiegeln die Dauer des Vorfalls wider.
    • Ein Diagramm zeigt die Zeitreihendaten und den Schwellenwert, die von der Benachrichtigungsrichtlinie verwendet wurden, die den Vorfall verursacht hat. Der Vorfall wurde geöffnet, als eine Zeitachse eine Bedingung der Benachrichtigungsrichtlinie erfüllte.

    Die Zeitachse gibt die Dauer des Vorfalls mit zwei beschrifteten Punkten an. Die Position dieser Punkte auf der Zeitachse bestimmt den Datenbereich, der im Diagramm für die Vorfallzeitachse angezeigt wird. Standardmäßig wird ein Punkt beim Öffnen des Vorfalls und einer beim Schließen des Vorfalls positioniert, oder zum aktuellen Zeitpunkt, wenn der Vorfall noch offen ist.

    Sie können den Zeitraum auf der Zeitachse des Vorfalls und im Diagramm ändern:

    • Ziehen Sie einen der Punkte entlang der Zeitachse, um den im Diagramm angezeigten Zeitraum zu ändern. Mit dieser Technik können Sie sich auf bestimmte Intervalle konzentrieren, z. B. um den Anfang oder das Ende des Vorfalls.

      Wenn Sie das Diagramm durch Ziehen der Punkte auf der Achse ändern, wird im Menü Zeitspanne ein benutzerdefinierter Wert festgelegt und das Menü wird deaktiviert. Klicken Sie auf Zurücksetzen, um das Menü Zeitspanne zu aktivieren.

    • Wählen Sie im Menü Zeitspanne einen Zeitraum aus, um den auf der Zeitachse angezeigten Zeitraum zu ändern.
  • Links zu anderen Tools zur Fehlerbehebung Die Konfiguration Ihres Projekts und der Benachrichtigungsrichtlinie sowie das Alter des Vorfalls bestimmen, welche Links verfügbar sind.
    • Klicken Sie auf Richtlinie ansehen, um die Detailseite für die Benachrichtigungsrichtlinie aufzurufen.
    • Klicken Sie zum Bearbeiten der Definition der Benachrichtigungsrichtlinie auf Richtlinie bearbeiten.
    • Wenn Sie ein Dashboard mit Leistungsinformationen für die Ressource aufrufen möchten, klicken Sie auf Ressourcendetails aufrufen.
    • Klicken Sie auf Logs ansehen, um zugehörige Logeinträge im Log Explorer aufzurufen. Weitere Informationen finden Sie unter Logs mit dem Log-Explorer ansehen.
    • Klicken Sie auf Im Metrics Explorer ansehen, um die Daten im Diagramm zu untersuchen.
  • Annotationen: Liefert ein Log mit Ihren Erkenntnissen, Ergebnissen, Vorschlägen oder anderen Kommentaren aus Ihrer Untersuchung des Vorfalls.
    • Wenn Sie eine Annotation hinzufügen möchten, geben Sie Text in das Feld ein und klicken auf Kommentar hinzufügen.
    • Klicken Sie auf Abbrechen, um den Kommentar zu verwerfen.

Vorfälle verwalten

Vorfälle haben einen der folgenden Zustände:

  • Offen: Die Bedingungen der Benachrichtigungsrichtlinie werden erfüllt oder es sind keine Daten vorhanden, die darauf hinweisen, dass die Bedingung nicht mehr erfüllt ist. Wenn eine Benachrichtigungsrichtlinie mehrere Bedingungen enthält, werden Vorfälle abhängig davon geöffnet, wie diese Bedingungen kombiniert werden. Weitere Informationen finden Sie unter Richtlinien mit mehreren Bedingungen.

  •  Acknowledged: Der Vorfall ist offen und wurde manuell als bestätigt gekennzeichnet. Dieser Status deutet in der Regel darauf hin, dass der Vorfall untersucht wird.

  • Geschlossen: Das System hat festgestellt, dass die Bedingung nicht mehr erfüllt wird, Sie haben den Vorfall geschlossen oder es sind 7 Tage vergangen, ohne dass ein Erfüllen der Bedingung beobachtet wurde. finden Sie weitere Informationen.

Wenn Sie eine Benachrichtigungsrichtlinie konfigurieren, stellen Sie sicher, dass der stabile Zustand ein Signal liefert, wenn alles in Ordnung ist. Dies ist notwendig, damit der fehlerfreie Zustand erkannt werden kann und, falls ein Vorfall offen ist, dieser geschlossen werden kann. Wenn kein Signal dafür vorliegt, dass eine Fehlerbedingung nicht mehr besteht, bleibt ein Vorfall nach dem Öffnen eines Vorfalls sieben Tage nach dem Auslösen der Benachrichtigungsrichtlinie geöffnet.

Wenn Sie beispielsweise eine Benachrichtigungsrichtlinie erstellen, durch die Sie informiert werden, wenn die Anzahl der Fehler größer als 0 ist, müssen Sie dafür sorgen, dass die Anzahl der Fehler 0 ist, wenn keine Fehler vorhanden sind. Wenn die Benachrichtigungsrichtlinie im fehlerfreien Zustand null oder leer zurückgibt, gibt es kein Signal, um anzugeben, wann die Fehler aufgehört haben. In einigen Situationen bietet Monitoring Query Language (MQL) die Möglichkeit, einen Standardwert anzugeben, der verwendet wird, wenn kein Messwert verfügbar ist. Ein Beispiel finden Sie unter Verhältnis verwenden.

Vorfälle bestätigen

Wir empfehlen Ihnen, einen Vorfall als bestätigt zu markieren, sobald Sie mit der Untersuchung des Vorfalls beginnen.

So markieren Sie einen Vorfall als "bestätigt":

  • Klicken Sie auf der Seite Benachrichtigungen im Bereich Vorfälle auf Alle Vorfälle ansehen.
  • Suchen Sie auf der Seite Vorfälle den Vorfall, den Sie bestätigen möchten, und führen Sie dann einen der folgenden Schritte aus:

    • Klicken Sie auf  Weitere Optionen und wählen Sie Bestätigen aus.
    • Öffnen Sie die Detailseite des Vorfalls und klicken Sie auf Vorfall bestätigen.

Wenn Ihre Benachrichtigungsrichtlinie so konfiguriert ist, dass wiederholte Benachrichtigungen gesendet werden, werden die Benachrichtigungen durch die Bestätigung eines Vorfalls nicht beendet. Sie haben folgende Möglichkeiten, sie zu stoppen:

  • Erstellen Sie eine Schlummerfunktion für die Benachrichtigungsrichtlinie.
  • Deaktivieren Sie die Benachrichtigungsrichtlinie.

Benachrichtigungsrichtlinie zurückstellen

Wenn Sie verhindern möchten, dass Monitoring während eines bestimmten Zeitraums Vorfälle erstellt und Benachrichtigungen sendet, können Sie die entsprechende Benachrichtigungsrichtlinie pausieren. Wenn Sie eine Benachrichtigungsrichtlinie zurückstellen, schließt Monitoring auch alle Vorfälle im Zusammenhang mit dieser Benachrichtigungsrichtlinie.

So erstellen Sie eine Schlummerfunktion für einen Vorfall, den Sie sich gerade ansehen:

  1. Klicken Sie auf der Seite Details zum Vorfall auf Zurückstellen.

  2. Wählen Sie die Dauer der Schlummerfunktion aus. Nachdem Sie die Dauer der Schlummerfunktion festgelegt haben, beginnt die Schlummerfunktion sofort.

Wenn Sie die Detailseite eines Vorfalls aufrufen, können Sie eine Schlummerfunktion für die zugehörige Benachrichtigungsrichtlinie erstellen. Klicken Sie dazu auf Zurückstellen und wählen Sie dann eine Dauer aus. Die Schlummerfunktion beginnt sofort. Sie können eine Benachrichtigungsrichtlinie auch auf der Seite Vorfälle zurückstellen. Suchen Sie dazu den Vorfall, für den Sie die Schlummerfunktion aktivieren möchten, klicken Sie auf  Weitere Optionen und wählen Sie dann Zurückstellen aus. Sie können Benachrichtigungsrichtlinien bei Ausfällen zurückstellen, um weitere Benachrichtigungen während der Fehlerbehebung zu verhindern.

Vorfälle schließen

Sie können einen Vorfall von Monitoring für Sie schließen lassen oder ihn nach Ende der Beobachtung schließen. Wenn Sie einen Vorfall schließen und dann Daten eintreffen, die angeben, dass die Bedingung erfüllt ist, wird ein neuer Vorfall erstellt. Wenn Sie einen Vorfall schließen, werden dadurch keine anderen Vorfälle geschlossen, die für dieselbe Bedingung offen sind. Wenn Sie eine Benachrichtigungsrichtlinie zurückstellen, werden offene Vorfälle zu Beginn der Schlummerfunktion geschlossen.

Monitoring schließt einen Vorfall automatisch, wenn eines der folgenden Ereignisse eintritt:

  • Bedingungen für Messwertschwellen:

    • Eine Beobachtung zeigt an, dass der Grenzwert nicht überschritten wurde.
    • Es gehen keine Beobachtungen ein. Die Bedingung ist so konfiguriert, dass Vorfälle geschlossen werden, wenn keine Beobachtungen eingehen, und der Status der zugrunde liegenden Ressource entweder unbekannt ist oder nicht deaktiviert ist.

    • Für die Dauer des automatischen Schließens der Benachrichtigungsrichtlinie gehen keine Beobachtungen ein und die Bedingung ist nicht so konfiguriert, dass Vorfälle automatisch geschlossen werden, wenn keine Beobachtungen eingehen. Zum Konfigurieren der Dauer für das automatische Schließen können Sie die Google Cloud Console oder die Cloud Monitoring API verwenden. Standardmäßig beträgt die Dauer für das automatische Schließen sieben Tage. Die Mindestdauer für das automatische Schließen beträgt 30 Minuten.

  • Bedingungen für fehlende Messwerte:

    • Es erfolgt eine Beobachtung.
    • Nach Ablauf des Zeitraums für das automatische Schließen der Benachrichtigungsrichtlinie erhalten Sie 24 Stunden lang keine Beobachtungen. Zum Konfigurieren der Dauer für das automatische Schließen können Sie die Google Cloud Console oder die Cloud Monitoring API verwenden. Standardmäßig beträgt die Dauer für das automatische Schließen sieben Tage.
  • Prognosebedingungen:

    • Es wird eine Prognose erstellt, die vorhersagt, dass die Zeitreihe nicht gegen den Grenzwert innerhalb des Prognosefensters verstößt.
    • 10 Minuten lang keine Beobachtungen eintreffen, die Bedingung ist so konfiguriert, dass Vorfälle geschlossen werden, wenn keine Beobachtungen eingehen, und der Status der zugrunde liegenden Ressource ist entweder unbekannt oder nicht deaktiviert.

    • Für die Dauer des automatischen Schließens der Benachrichtigungsrichtlinie gehen keine Beobachtungen ein und die Bedingung ist nicht so konfiguriert, dass Vorfälle automatisch geschlossen werden, wenn keine Beobachtungen eingehen.

Eine Benachrichtigungsrichtlinie hat beispielsweise einen Vorfall generiert, weil die Latenz der HTTP-Antwort zehn Minuten lang größer als 2 Sekunden war. Wenn die nächste Messung der HTTP-Antwortlatenz kleiner oder gleich zwei Sekunden ist, wird der Vorfall geschlossen. Ebenso gilt: Wenn sieben Tage lang keine Daten empfangen werden, wird der Vorfall geschlossen.

So schließen Sie einen Vorfall:

  1. Klicken Sie auf der Seite Benachrichtigungen im Bereich Vorfälle auf Alle Vorfälle ansehen.
  2. Suchen Sie auf der Seite Vorfälle den Vorfall, den Sie schließen möchten, und führen Sie dann einen der folgenden Schritte aus:

    • Klicken Sie auf  Mehr anzeigen und wählen Sie dann Vorfall schließen aus.
    • Öffnen Sie die Detailseite des Vorfalls und klicken Sie auf Vorfall schließen.

Wenn die Meldung Unable to close incident with active conditions angezeigt wird, kann der Vorfall nicht geschlossen werden, da innerhalb des letzten Benachrichtigungszeitraums Daten empfangen wurden.

Wenn die Meldung Unable to close incident. Please try again in a few minutes. angezeigt wird, konnte der Vorfall aufgrund eines internen Fehlers nicht geschlossen werden.

Datenaufbewahrung und ‐limits

Informationen zu Limits und zur Aufbewahrungsdauer von Vorfällen finden Sie unter Limits für Benachrichtigungen.

Nächste Schritte

* Eine detaillierte Darstellung der Konzepte von Benachrichtigungsrichtlinien finden Sie unter Verhalten von messwertbasierten Benachrichtigungsrichtlinien.