Vorfälle für messwertbasierte Benachrichtigungsrichtlinien

Ein Vorfall ist ein Datensatz, der angibt, wann die Bedingung oder Bedingungen einer Benachrichtigung erfüllt sind. Wenn die Bedingungen erfüllt sind, erstellt Cloud Monitoring in der Regel einen Vorfall und sendet eine Benachrichtigung. Vorfälle werden jedoch nicht erstellt, wenn die Richtlinie pausiert oder deaktiviert ist, wenn zu viele Vorfälle für diese Richtlinie geöffnet sind oder wenn die zugrunde liegende Ressource bekanntlich deaktiviert ist. Wenn eine Benachrichtigungsrichtlinie mehrere Bedingungen enthält, wird darin auch angegeben, ob das Erfüllen einer Bedingung ausreicht, um einen Vorfall zu erstellen. Ein Vorfall ist ein Eintrag dazu, wann die Bedingung einer Benachrichtigungsrichtlinie erfüllt wird. Wenn eine Bedingung erfüllt ist, öffnet Cloud Monitoring in der Regel einen Vorfall sendet eine Benachrichtigung, wenn ein Protokoll empfangen wird, das die Bedingung von Ihrer Benachrichtigungsrichtlinie. Bei den folgenden Typen werden jedoch keine Vorfälle erstellt: Gegebenheiten:

  • Die Richtlinie ist zurückgestellt oder deaktiviert.
  • Die maximale Anzahl an Benachrichtigungen überschreitet die zulässige Obergrenze von 1 Benachrichtigung alle 5 Minuten für jede logbasierte Benachrichtigungsrichtlinie.
  • Die tägliche Gesamtzahl der Benachrichtigungen würde das Limit von 20 Benachrichtigungen pro Tag für jede logbasierte Benachrichtigungsrichtlinie.

Monitoring erstellt für jeden Vorfall Vorfalldetails. Seite, auf der Sie den Vorfall verwalten und Informationen zum Vorfall melden können damit Sie den Fehler beheben können. Auf der Seite Details zu Vorfällen sehen Sie beispielsweise die Zeitachse des Vorfalls und ein Diagramm mit den überwachten Messwertdaten. Außerdem finden Sie hier Links zu zugehörige Vorfälle und Logeinträge.

In diesem Dokument wird beschrieben, wie Sie Ihre Vorfälle finden. Sie beschreibt auch wie Sie auf der Seite Vorfalldetails Vorfälle für messwertbasierte Benachrichtigungsrichtlinien, die von Cloud Monitoring gespeicherte Zeitreihendaten auswerten.

Hinweise

Prüfen Sie, ob Sie die erforderlichen Berechtigungen haben:

So erhalten Sie die Berechtigungen, die Sie zum Aufrufen und Verwalten von Vorfällen über die Google Cloud Console benötigen: bitten Sie Ihren Administrator, Ihnen folgende IAM-Rollen für Ihr Projekt:

Weitere Informationen zum Zuweisen von Rollen finden Sie unter Zugriff auf Projekte, Ordner und Organisationen verwalten.

Sie können die erforderlichen Berechtigungen auch über benutzerdefinierte Rollen oder andere vordefinierte Rollen erhalten.

Weitere Informationen zu Cloud Monitoring-Rollen finden Sie unter Zugriff mit Identity and Access Management steuern.

Vorfälle suchen

So rufen Sie eine Liste der Vorfälle in Ihrem Google Cloud-Projekt auf:

  1. Rufen Sie in der Google Cloud Console die Seite  Benachrichtigungen auf:

    Zu Benachrichtigungen

    Wenn Sie diese Seite über die Suchleiste suchen, wählen Sie das Ergebnis aus, dessen Zwischenüberschrift Monitoring ist.

    • Im Bereich Zusammenfassung wird die Anzahl der offenen Vorfälle angezeigt.
    • Im Bereich Vorfälle werden die zuletzt geöffneten Vorfälle angezeigt. Klicken Sie auf Geschlossene Vorfälle anzeigen, um die neuesten Vorfälle einschließlich geschlossener Vorfälle in der Tabelle aufzulisten.
  2. Wenn Sie die Details zu einem bestimmten Vorfall aufrufen möchten, wählen Sie das Vorfalls in der Liste.

    Die Seite Vorfalldetails wird geöffnet. Weitere Informationen zur Die Seite Vorfalldetails finden Sie in der Auf dieser Seite finden Sie den Abschnitt Vorfälle untersuchen.

Ältere Vorfälle finden

Im Bereich Vorfälle auf der Seite Benachrichtigungen werden die jüngsten offenen Vorfälle angezeigt. Führen Sie einen der folgenden Schritte aus, um nach älteren Vorfällen zu suchen:

  • Klicken Sie auf  Neuer oder  Älter, um die Einträge in der Tabelle Vorfälle durch zu gehen.

  • Klicken Sie auf Alle Vorfälle ansehen, um die Seite Vorfälle aufzurufen. Auf der Seite Vorfälle haben Sie folgende Möglichkeiten:

    • Geschlossene Vorfälle anzeigen: Klicken Sie auf Geschlossene Vorfälle anzeigen, um alle Vorfälle in der Tabelle aufzulisten.
    • Filtervorfälle: Informationen zum Hinzufügen von Filtern finden Sie unter Vorfälle filtern:
    • Bestätigen oder schließen Sie einen Vorfall oder pausieren Sie die zugehörige Benachrichtigungsrichtlinie. Um auf diese Optionen zuzugreifen, Klicken Sie in der Zeile des Vorfalls auf  Weitere Optionen. und wählen Sie im Menü eine Option aus. Weitere Informationen finden Sie unter Vorfälle verwalten.

Vorfälle filtern

Wenn Sie einen Wert in die Filterleiste eingeben, werden nur Vorfälle aus der Tabelle Vorfälle aufgelistet, die dem Filter entsprechen. Wenn Sie mehrere Filter hinzufügen, wird ein Vorfall nur angezeigt, wenn er alle Filter erfüllt.

So fügen Sie einer Tabelle mit Vorfällen einen Filter hinzu:

  1. Klicken Sie auf der Seite Vorfälle auf  Tabelle filtern und wählen Sie ein Filterattribut. Filterattribute umfassen alle folgenden Elemente:

    • Zustand des Vorfalls
    • Name der Benachrichtigungsrichtlinie
    • Wann der Vorfall geöffnet oder geschlossen wurde
    • Messwerttyp
    • Ressourcentyp
  2. Wählen Sie einen Wert aus dem sekundären Menü oder geben Sie einen Wert in die Filterleiste ein.

    Wenn Sie beispielsweise Messwerttyp auswählen und usage_time eingeben, sehen Sie möglicherweise nur die folgenden Optionen im sekundären Menü:

    agent.googleapis.com/cpu/usage_time
    compute.googleapis.com/guest/container/cpu/usage_time
    container.googleapis.com/container/cpu/usage_time
    

Vorfall untersuchen

Auf der Seite Details zum Vorfall finden Sie Informationen, die Ihnen helfen können, die Ursache eines Vorfalls zu ermitteln.

Messwertdaten analysieren

So analysieren Sie den Status Ihres Messwerts vor und nach dem Vorfall: das Diagramm Benachrichtigungsmesswerte verwenden. Dieses Diagramm zeigt eine Zeitachse und die Zeitreihe, die dazu geführt hat, dass die Bedingung Ihrer Benachrichtigungsrichtlinie erfüllt wurde.

Sie können den Bereich der Zeitachse anpassen, um nach Trends und Mustern in Ihrem Messwertdaten zum Vorfall bezogen:

  • Wenn Sie nur die Zeitreihe anzeigen lassen möchten, aufgrund derer die Bedingung erfüllt wurde, oder alle Zeitreihen, für die die Bedingung ausgewertet wird, klicken Sie auf  Alle Zeitreihen anzeigen.

  • Mit der Option „Zeitraum“ können Sie den Zeitraum ändern, der im Diagramm angezeigt wird. in der Symbolleiste oder markieren Sie im Diagramm Zeitbereiche Zeiger.

Sie können Ihre Messwertdaten auch im Metrics Explorer genauer analysieren. Rufen Sie dazu die Messwerte für Benachrichtigungen auf. und dann auf Daten auswerten. Standardmäßig werden im Metrics Explorer Messwertdaten zusammengefasst und gefiltert, Das Diagramm entspricht der Zeitreihe auf der Zeitachse für Benachrichtigungsmesswerte.

Logeinträge untersuchen

Im Bereich Protokolle auf der Seite Details zum Vorfall werden Logeinträge angezeigt, die mit dem Ressourcentyp und den Labels der überwachten Ressource für Ihren Messwert übereinstimmen. Sie können diese Protokolleinträge analysieren, um zusätzliche Informationen zu erhalten, die Ihnen bei der Fehlerbehebung helfen können.

  • Zum Aufrufen der Logeinträge im Log-Explorer klicken Sie auf Sehen Sie sich den Log-Explorer an und wählen Sie dann ein den Umfang festlegendes Projekt aus. Der Log-Explorer bietet zusätzliche Tools zum Analysieren von Logeintragsdaten. z. B. eine Zeitachse für die Erstellung zugehöriger Logeinträge.
  • So können Sie die Abfrage, die zum Filtern der Log-Einträge verwendet wird, in der Metrics Explorer, klicken Sie auf Daten auswerten.

Zusätzliche Informationen ansehen

Im Abschnitt Labels werden die Labels und Werte für die überwachte Ressource angezeigt. und Messwert der Zeitreihe, die den Vorfall verursacht hat, sowie Nutzerlabels die in der Benachrichtigungsrichtlinie definiert ist. Anhand dieser Informationen können Sie die überwachte Ressource ermitteln, die den Vorfall verursacht hat. Weitere Informationen finden Sie unter Vorfälle mit Labels versehen.

Der Abschnitt Dokumentation enthält die Dokumentationsvorlage für Benachrichtigungen erhalten, die Sie beim Erstellen der Benachrichtigungsrichtlinie angegeben haben. Diese Informationen können eine Beschreibung der überwacht und enthält Tipps zur Minderung. Weitere Informationen finden Sie unter Benachrichtigungen mit benutzerdefinierter Dokumentation versehen.

Wenn Sie keine Dokumentation für Ihre Benachrichtigungsrichtlinie konfiguriert haben, wird im Bereich Dokumentation die Meldung „Keine Dokumentation konfiguriert“ angezeigt.

Wenn Sie die zugrunde liegenden Probleme in Ihrer Anwendung ermitteln möchten, können Sie sich Vorfälle ansehen, die mit anderen Bedingungen der Benachrichtigungsrichtlinie zusammenhängen.

Im Abschnitt Zugehörige Vorfälle wird eine Liste der Vorfälle angezeigt. die mit einem der folgenden Kriterien übereinstimmen:

  • Der Vorfall wurde erstellt, als eine Bedingung derselben Benachrichtigungsrichtlinie Folgendes war: erfüllt sind.
  • Der Vorfall hat dasselbe Label wie der Vorfall auf der Seite mit den Vorfalldetails.

Vorfälle verwalten

Vorfälle haben einen der folgenden Zustände:

  • Geöffnet: Die Bedingungen der Benachrichtigungsrichtlinie sind erfüllt oder es sind keine Daten vorhanden um anzuzeigen, dass die Bedingung nicht mehr erfüllt ist. Wenn eine Benachrichtigungsrichtlinie mehrere Bedingungen enthält, werden Vorfälle geöffnet, je nachdem, wie diese Bedingungen kombiniert werden. Weitere Informationen finden Sie unter Richtlinien mit mehreren Bedingungen.

  •  Acknowledged: Der Vorfall ist offen und wurde manuell als bestätigt gekennzeichnet. Dieser Status deutet in der Regel darauf hin, dass der Vorfall untersucht wird.

  • Geschlossen: Das System hat festgestellt, dass die Bedingung nicht mehr erfüllt wird, Sie haben den Vorfall geschlossen oder es sind 7 Tage vergangen, ohne dass ein Erfüllen der Bedingung beobachtet wurde. finden Sie weitere Informationen.

Wenn Sie eine Benachrichtigungsrichtlinie konfigurieren, stellen Sie sicher, dass der stabile Zustand ein Signal liefert, wenn alles in Ordnung ist. Dies ist notwendig, damit der fehlerfreie Zustand erkannt werden kann und, falls ein Vorfall offen ist, dieser geschlossen werden kann. Wenn es kein Signal gibt, das anzeigt, dass ein Fehlerzustand gestoppt wurde, bleibt ein Vorfall nach dem Öffnen der Richtlinie noch 7 Tage lang offen.

Wenn Sie z. B. eine Benachrichtigungsrichtlinie erstellen, Fehler größer als 0 ist, sorgen Sie dafür, dass wenn keine Fehler vorhanden sind. Wenn die Benachrichtigungsrichtlinie null oder leer ist, wird kein Signal gesendet, um anzuzeigen, mehr Fehler aufgetreten. In einigen Situationen unterstützt Monitoring Query Language (MQL) die Möglichkeit zur Angabe eines Standardwerts, der verwendet wird, wenn kein gemessener Wert verfügbar ist. Ein Beispiel finden Sie unter Nutzungsverhältnis.

Vorfälle bestätigen

Wir empfehlen Ihnen, einen Vorfall als bestätigt zu markieren, sobald Sie mit der Untersuchung des Vorfalls beginnen.

So markieren Sie einen Vorfall als "bestätigt":

  1. Klicken Sie auf der Seite Benachrichtigungen im Bereich Vorfälle auf Alle Vorfälle ansehen.
  2. Suchen Sie auf der Seite Vorfälle den Vorfall, den Sie bestätigen möchten, und führen Sie dann einen der folgenden Schritte aus:

    • Klicken Sie auf  Weitere Optionen und wählen Sie Bestätigen aus.
    • Öffnen Sie die Detailseite des Vorfalls und klicken Sie auf Vorfall bestätigen.

Wenn Ihre Benachrichtigungsrichtlinie so konfiguriert ist, wiederholte Benachrichtigungen senden und dann eine die Benachrichtigungen nicht beendet. Sie haben folgende Möglichkeiten, sie zu stoppen:

  • Erstellen Sie eine Schlummerfunktion für die Benachrichtigungsrichtlinie.
  • Deaktivieren Sie die Benachrichtigungsrichtlinie.

Benachrichtigungsrichtlinie pausieren

Wenn Sie verhindern möchten, dass Monitoring in einem bestimmten Zeitraum Vorfälle erstellt und Benachrichtigungen sendet, können Sie die entsprechende Benachrichtigungsrichtlinie pausieren. Wenn Sie eine Benachrichtigungsrichtlinie pausieren, werden in Monitoring auch alle zugehörigen Vorfälle geschlossen.

So setzen Sie eine Schlummerfunktion für einen angezeigten Vorfall:

  1. Klicken Sie auf der Seite Vorfalldetails auf Richtlinie für Schlummerfunktion.

  2. Wählen Sie die Dauer der Schlummerfunktion aus. Nachdem Sie die Dauer der Schlummerfunktion festgelegt haben, beginnt sofort.

Sie können eine Benachrichtigungsrichtlinie auch auf der Seite Vorfälle pausieren. Suchen Sie dazu den Vorfall, den Sie pausieren möchten, klicken Sie auf  Weitere Optionen und wählen Sie dann Pausieren aus. Sie können Benachrichtigungsrichtlinien bei Ausfällen zurückstellen, um weitere Benachrichtigungen erhalten.

Vorfälle schließen

Sie können Monitoring einen Vorfall für Sie schließen lassen oder einen Vorfall schließen, nachdem keine Beobachtungen eingehen. Wenn Sie einen Vorfall schließen und dann Daten eintreffen, die auf den Zustand hinweisen wird ein neuer Vorfall erstellt. Wenn Sie einen Vorfall schließen, werden dadurch keine anderen Vorfälle geschlossen, die aufgrund derselben Bedingung geöffnet sind. Wenn Sie eine Benachrichtigungsrichtlinie zurückstellen, werden offene Vorfälle geschlossen, wenn die Schlummerfunktion beginnt.

Monitoring schließt einen Vorfall automatisch, wenn einer der Folgendes geschieht:

  • Bedingungen für Messwertschwellen:

    • Es wird eine Beobachtung erfasst, die darauf hinweist, dass der Grenzwert nicht überschritten wird.
    • Es werden keine Beobachtungen empfangen, die Bedingung ist so konfiguriert, dass Vorfälle geschlossen werden, wenn keine Beobachtungen mehr eingehen, und der Status der zugrunde liegenden Ressource ist entweder unbekannt oder nicht deaktiviert.

    • Während der Dauer des automatischen Schließens der Benachrichtigung erhalten keine Beobachtungen Richtlinie und die Bedingung ist nicht so konfiguriert, dass Vorfälle automatisch geschlossen werden wenn keine Beobachtungen eingehen. So konfigurieren Sie das automatische Schließen können Sie die Google Cloud Console oder die Cloud Monitoring API Standardmäßig beträgt die Dauer der automatischen Schließung sieben Tage. Die Mindestdauer für das automatische Schließen beträgt 30 Minuten.

  • Bedingungen für fehlende Messwerte:

    • Es erfolgt eine Beobachtung.
    • In einem Zeitraum von 24 Stunden erhalten Sie keine Beobachtungen. die Dauer für das automatische Schließen der Benachrichtigungsrichtlinie abläuft. Zum Konfigurieren Dauer des automatischen Schließens verwenden, können Sie dies in der Google Cloud Console Cloud Monitoring API Standardmäßig beträgt die Dauer der automatischen Schließung sieben Tage.
  • Prognosebedingungen:

    • Es wird eine Prognose erstellt, die prognostiziert, dass die Zeitreihe nicht gegen Grenzwert innerhalb des Prognosefensters.
    • 10 Minuten lang werden keine Beobachtungen empfangen. Die Bedingung ist so konfiguriert, dass Vorfälle geschlossen werden, wenn keine Beobachtungen mehr eingehen. Der Status der zugrunde liegenden Ressource ist entweder unbekannt oder nicht deaktiviert.

    • Während der Dauer für das automatische Schließen der Benachrichtigungsrichtlinie werden keine Beobachtungen erfasst und die Bedingung ist nicht so konfiguriert, dass Vorfälle automatisch geschlossen werden, wenn keine Beobachtungen mehr eingehen.

Eine Benachrichtigungsrichtlinie hat beispielsweise einen Vorfall generiert, weil der Die Latenz der HTTP-Antwort betrug 10 aufeinanderfolgende Sekunden größer als 2 Sekunden Minuten. Wenn die nächste Messung der HTTP-Antwortlatenz kleiner ist als oder gleich zwei Sekunden, wird der Vorfall geschlossen. Wenn überhaupt keine Daten empfangen werden, ist der Vorfall geschlossen.

So schließen Sie einen Vorfall:

  1. Führen Sie auf der Seite Benachrichtigungen im Bereich Vorfälle folgende Schritte aus: Klicken Sie auf Alle Vorfälle ansehen.
  2. Suchen Sie auf der Seite Vorfälle den Vorfall, den Sie schließen möchten, und führen Sie dann einen der folgenden Schritte aus:

    • Klicken Sie auf  Mehr anzeigen und wählen Sie Vorfall schließen aus.
    • Öffnen Sie die Seite Details zum Vorfall für diesen Vorfall und klicken Sie auf Vorfall schließen.
Wenn die Meldung Unable to close incident with active conditions angezeigt wird, kann der Vorfall nicht geschlossen werden, da die Daten innerhalb letzten Benachrichtigungszeitraum.

Wenn Sie die Meldung Unable to close incident. Please try again in a few minutes. sehen, konnte der Vorfall aufgrund eines internen Fehlers nicht geschlossen werden.

Datenaufbewahrung und -limits

Informationen zu Beschränkungen und zur Aufbewahrungsdauer von Vorfällen Siehe Grenzwerte für Benachrichtigungen.

Nächste Schritte