Benachrichtigungsrichtlinien mit Messwertschwellen erstellen

In diesem Dokument wird beschrieben, wie Sie mit der Google Cloud Console ein messwertbasierte Benachrichtigungen Richtlinie, die Benachrichtigungen sendet Die Werte eines Messwerts sind größer oder kleiner als der Grenzwert. für ein bestimmtes Fenster für die Wiederholung der Prüfung. Zum Beispiel könnte die Bedingung einer Benachrichtigungsrichtlinie kann erfüllt sein, wenn die CPU-Auslastung für mindestens fünf Minuten.

Dieser Inhalt gilt nicht für logbasierte Benachrichtigungsrichtlinien. Informationen zu logbasierten Benachrichtigungsrichtlinien, die Sie benachrichtigen, wenn eine bestimmte Nachricht in Ihren Logs angezeigt wird, finden Sie unter Logs überwachen.

In diesem Dokument wird Folgendes nicht beschrieben:

Hinweis

  1. So erhalten Sie die Berechtigungen, die Sie zum Erstellen und Ändern von Benachrichtigungsrichtlinien über die Google Cloud Console benötigen: bitten Sie Ihren Administrator, Ihnen IAM-Rolle Monitoring-Bearbeiter (roles/monitoring.editor) für Ihr Projekt. Weitere Informationen zum Zuweisen von Rollen finden Sie unter Zugriff auf Projekte, Ordner und Organisationen verwalten.

    Sie können die erforderlichen Berechtigungen auch über benutzerdefinierte Rollen oder andere vordefinierte Rollen erhalten.

    Weitere Informationen zu Cloud Monitoring-Rollen finden Sie unter Zugriff mit Identity and Access Management steuern.

  2. Machen Sie sich mit den allgemeinen Konzepten von Benachrichtigungsrichtlinien vertraut. Weitere Informationen zu diesen Themen finden Sie unter Benachrichtigungen – Übersicht.

  3. Konfigurieren Sie die Benachrichtigungskanäle, über die Sie Benachrichtigungen erhalten möchten. Aus Gründen der Redundanz empfehlen wir, mehrere Arten von Benachrichtigungskanälen zu erstellen. Weitere Informationen finden Sie unter Benachrichtigungskanäle erstellen und verwalten

Benachrichtigungsrichtlinie erstellen

So erstellen Sie eine Benachrichtigungsrichtlinie, die den Wert dieses Messwerts mit einem statischen Grenzwert vergleicht:

  1. Rufen Sie in der Google Cloud Console die Seite  Benachrichtigungen auf:

    Zu Benachrichtigungen

    Wenn Sie diese Seite über die Suchleiste suchen, wählen Sie das Ergebnis aus, dessen Zwischenüberschrift Monitoring ist.

  2. Wählen Sie Richtlinie erstellen aus.
  3. Wählen Sie die zu überwachende Zeitreihe aus:

    1. Klicken Sie auf Messwert auswählen und wählen Sie in den Menüs einen Ressourcentyp und Messwerttyp und klicken Sie dann auf Anwenden.

      Das Menü Messwert auswählen enthält Funktionen, mit denen Sie die verfügbaren Messwerttypen finden können:

      • Um einen bestimmten Messwerttyp zu finden, verwenden Sie die Methode Filterleiste. Wenn Sie beispielsweise util eingeben, werden im Menü nur Einträge angezeigt, die util enthalten. Einträge werden angezeigt, wenn sie einen Groß-/Kleinschreibungs-insensitiven „contains“-Test bestehen.
      • Wenn Sie alle Messwerttypen sehen möchten, auch die ohne Daten, klicken Sie auf  Aktiv. Standardmäßig werden in den Menüs nur Messwerttypen mit Daten angezeigt. Weitere Informationen finden Sie unter Messwert nicht im Menü aufgeführt.

      Sie können jeden integrierten Messwert oder jeden benutzerdefinierten Messwert überwachen.

    2. Optional: Wenn Sie einen Teil der Zeitreihe überwachen möchten, der mit den Mess- und Ressourcentypen übereinstimmt, die Sie im vorherigen Schritt ausgewählt haben, klicken Sie auf Filter hinzufügen. Wählen Sie im Filterdialogfeld das Label aus, nach dem gefiltert werden soll, ein Vergleichsoperator und dann der Filterwert. Der Filter zone =~ ^us.*.a$ verwendet beispielsweise einen regulären Ausdruck, um stimmt mit allen Zeitreihendaten überein, deren Zonenname mit us beginnt und endet. mit a. Weitere Informationen finden Sie unter Ausgewählte Zeitreihe filtern.

    3. Optional: So ändern Sie die Ausrichtung der Punkte in einer Zeitreihe: Legen Sie im Abschnitt Daten transformieren das Rollierende Fenster und Funktionsfelder für rollierende Fenster:

      Wenn Sie einen logbasierten Messwert überwachen, empfehlen wir, dass der Das Menü Rollierendes Fenster ist auf mindestens 10 Minuten eingestellt.

      Diese Felder geben an, wie die in einem Fenster aufgezeichneten Punkte kombiniert werden. Angenommen, das Fenster beträgt 15 Minuten und die Fensterfunktion ist max. Der ausgerichtete Punkt ist der Höchstwert aller Punkte in den letzten 15 Minuten. Weitere Informationen finden Sie unter Ausrichtung: Regularisierung innerhalb der Reihe.

      Sie können auch die Rate überwachen, mit der sich ein Messwert ändert, indem Sie das Feld Funktion für den gleitenden Durchschnitt auf prozentuale Änderung festlegen. Weitere Informationen finden Sie unter Änderungsrate überwachen.

    4. Optional: Kombinieren Sie Zeitreihen, wenn Sie die Anzahl der Zeitreihen reduzieren möchten, die durch eine Richtlinie überwacht werden, oder wenn Sie nur eine Sammlung von Zeitreihen überwachen möchten. Anstatt beispielsweise die CPU-Auslastung jeder VM-Instanz zu überwachen, können Sie den Durchschnitt der CPU-Auslastung für alle VMs in einer Zone berechnen und dann diesen Durchschnitt überwachen. Standardmäßig Zeitreihen nicht kombiniert werden. Allgemeine Informationen finden Sie unter Reduzierung: Zeitreihen kombinieren:

      So kombinieren Sie alle Zeitreihen:

      1. Gehen Sie im Abschnitt Über mehrere Zeitreihen hinweg so vor: Klicken Sie auf Maximieren.
      2. Legen Sie für das Feld Zeitreihenaggregation einen anderen Wert als none fest. Wenn Sie beispielsweise den Durchschnittswert der Zeitreihe anzeigen möchten, wählen Sie mean aus.
      3. Achten Sie darauf, dass das Feld Zeitachsen gruppieren nach leer ist.

      So kombinieren oder gruppieren Sie Zeitreihen nach Labelwerten:

      1. Gehen Sie im Abschnitt Über mehrere Zeitreihen hinweg so vor: Klicken Sie auf Maximieren.
      2. Legen Sie für das Feld Zeitreihenaggregation einen anderen Wert als none
      3. Wählen Sie im Feld Zeitreihen gruppieren nach die Labels aus. nach dem gruppiert werden soll.

      Wenn Sie beispielsweise nach dem Label zone gruppieren und dann das Aggregationsfeld auf den Wert mean festlegen, wird im Diagramm für jede Zone, für die Daten vorhanden sind, eine Zeitachse angezeigt. Die für eine bestimmte Zone angezeigte Zeitreihe ist der Durchschnitt aller Zeitreihen mit dieser Zone.

    5. Klicken Sie auf Weiter.

  4. Konfigurieren Sie den Bedingungstrigger:

    1. Belassen Sie das Feld Bedingungstyp auf dem Standardwert von Grenzwert:

    2. Optional: Aktualisieren Sie das Menü Trigger für Benachrichtigungen. hat die folgenden Werte:

      • Beliebiger Verstoß gegen die Zeitreihe: Standardeinstellung. Wenn eine Zeitreihe den Grenzwert für das gesamte Wiederholungsfenster überschreitet, ist die Bedingung erfüllt.

      • Prozentsatz der Zeitreihen verstößt: Ein Prozentsatz der Zeitreihe muss den Grenzwert für das gesamte Zeitfenster für die erneute Prüfung überschreiten bevor die Bedingung erfüllt ist. Beispiel: Du wirst möglicherweise benachrichtigt, wenn 50% der überwachten Zeitreihen gegen die Richtlinien verstoßen den Grenzwert für das gesamte Fenster für den erneuten Test.

      • Number of time series violates (Wenn Anzahl an Zeitachsen verstößt): Eine bestimmte Anzahl von Zeitachsen muss während des gesamten Wiederholungszeitraums gegen den Grenzwert verstoßen, damit die Bedingung erfüllt ist. Für Sie könnten z. B. benachrichtigt werden, wenn 32 der überwachten verstoßen gegen den Grenzwert für das gesamte Zeitfenster für die erneute Prüfung.

      • All timeseries violation: Alle Zeitreihen müssen gegen die Grenzwert für das gesamte Fenster für den erneuten Test, bevor die Bedingung erfüllt ist.

      Informationen zu den Intervallen, die in Monitoring zum Ausrichten und Messen von Zeitreihendaten verwendet werden, finden Sie unter Ausrichtungszeiträume und Testfenster.

    3. Geben Sie mithilfe der Methode Felder Schwellenwertposition und Schwellenwert: Wenn Sie diese Werte beispielsweise auf Über Schwellenwert und 0.3 setzen, wird der Grenzwert überschritten, wenn ein Messwert über 0.3 liegt.

    4. Optional: Wenn Sie festlegen möchten, wie lange Messwerte den Grenzwert überschreiten müssen, bevor eine Benachrichtigung gesendet wird, maximieren Sie Erweiterte Optionen und verwenden Sie das Menü Zeitfenster für Wiederholung.

      Der Standardwert ist No retest. Mit dieser Einstellung wird eine einzelne kann eine Benachrichtigung zur Folge haben. Weitere Informationen und ein Beispiel: Einstellungen für Ausrichtungszeitraum und Dauer:

    5. Optional: So legen Sie fest, wie Monitoring die wann Daten nicht mehr ankommen, erweitern Sie Erweiterte Optionen und klicken Sie dann auf das Drop-down-Menü Bewertung fehlende Daten. .

      Das Menü Auswertung fehlender Daten ist deaktiviert, wenn der Wert für das Fenster zum nochmaligen Testen Kein nochmaliger Test ist.

      Google Cloud Console
      Feld „Bewertung fehlender Daten“
      Fazit Details
      Fehlende Daten (leer) Offene Vorfälle bleiben offen.
      Neue Vorfälle werden nicht geöffnet.

      Wenn Bedingungen erfüllt sind, ist die Bedingung weiterhin wenn keine Daten mehr eingehen. Wenn für diese Bedingung bereits ein Vorfall geöffnet ist, bleibt er offen. Wenn ein Vorfall geöffnet ist und keine Daten eingehen, startet der Timer für die automatische Schließung nach einer Verzögerung von mindestens 15 Minuten. Wenn der Timer abläuft, wird der Vorfall geschlossen.

      Wenn Bedingungen nicht erfüllt werden, ist das auch dann der Fall, wenn keine Daten mehr eingehen.

      Fehlende Datenpunkte, die als Werte behandelt werden, die gegen die Richtlinienbedingung verstoßen Offene Vorfälle bleiben offen.
      Neue Vorfälle können geöffnet werden.

      Wenn eine Bedingung erfüllt ist, gilt das auch dann, wenn keine Daten mehr eingehen. Wenn ein Vorfall für diese Bedingung offen ist, bleibt der Vorfall offen. Wenn ein Vorfall offen ist und keine Daten eintreffen für die Dauer des automatischen Schließens plus 24 Stunden, wenn der Vorfall geschlossen ist.

      Wenn Bedingungen nicht erfüllt sind, führt diese Einstellung dazu, dass sich die Bedingung für Messwertschwellen wie eine metric-absence condition verhält. Wenn Daten nicht innerhalb der im Fenster für die erneute Prüfung festgelegten Zeit eintreffen, gilt die Bedingung als erfüllt. Bei einer Benachrichtigungsrichtlinie mit einer Bedingung wird ein Vorfall geöffnet, wenn die Bedingung erfüllt ist.

      Fehlende Datenpunkte werden als Werte behandelt, die nicht gegen die Richtlinienbedingung verstoßen Offene Vorfälle werden geschlossen.
      Neue Vorfälle werden nicht geöffnet.

      Bei erfüllten Bedingungen ist das nicht mehr der Fall, wenn keine Daten mehr eingehen. Wenn ein Vorfall aufgrund dieser Bedingung geöffnet ist, wird er geschlossen.

      Wenn Bedingungen nicht erfüllt werden, ist das auch dann der Fall, wenn keine Daten mehr eingehen.

    6. Klicken Sie auf Weiter.

  5. Optional: Erstellen Sie eine Benachrichtigungsrichtlinie mit mehreren Bedingungen.

    Die meisten Richtlinien überwachen einen einzelnen Messwerttyp. So kann eine Richtlinie beispielsweise die Anzahl der Byte überwachen, die in eine VM-Instanz geschrieben werden. Wann du möchtest Um mehrere Messwerttypen zu überwachen, erstellen Sie eine Richtlinie mit mehreren Bedingungen. Für jede Bedingung wird ein Messwerttyp überwacht. Nachdem Sie die Bedingungen erstellt haben, wie die Bedingungen kombiniert werden. Weitere Informationen finden Sie unter Richtlinien mit mehreren Bedingungen:

    So erstellen Sie eine Benachrichtigungsrichtlinie mit mehreren Bedingungen:

    1. Klicken Sie für jede weitere Bedingung auf Benachrichtigungsbedingung hinzufügen und dann auf konfigurieren Sie diese Bedingung.
    2. Klicken Sie auf Weiter und konfigurieren Sie, wie Bedingungen kombiniert werden sollen.
    3. Klicken Sie auf Weiter, um mit der Einrichtung von Benachrichtigungen und Dokumentation fortzufahren.
  6. Benachrichtigungen konfigurieren:

    1. Maximieren Sie das Menü Benachrichtigungen und Name und wählen Sie die gewünschten Benachrichtigungskanäle aus. Aus Gründen der Redundanz empfehlen wir, Benachrichtigungsrichtlinie mit mehreren Arten von Benachrichtigungskanälen. Weitere Informationen finden Sie unter Benachrichtigungskanäle verwalten.

    2. Optional: Wenn Sie benachrichtigt werden möchten, wenn ein Vorfall geschlossen wird, wählen Sie Beim Schließen von Vorfällen benachrichtigen aus. Wenn Sie eine Benachrichtigungsrichtlinie mit der Methode Google Cloud Console wird nur bei einem Vorfall eine Benachrichtigung gesendet, erstellt.

    3. Optional: Wenn Sie ändern möchten, wie lange das Monitoring wartet, bevor ein Vorfall geschlossen wird, nachdem keine Daten mehr eingehen, wählen Sie eine Option aus dem Menü Dauer bis zur automatischen Schließung von Vorfällen aus. Wenn keine Daten mehr eingehen, wartet Monitoring standardmäßig sieben Tage, bevor ein geöffneter Vorfall geschlossen wird.

    4. Wählen Sie im Menü Schweregrad der Richtlinie eine Option aus. Bei Vorfällen und Benachrichtigungen wird der Schweregrad angezeigt.

    5. Optional: Wenn Sie der Benachrichtigungsrichtlinie benutzerdefinierte Labels hinzufügen möchten, gehen Sie im Abschnitt Richtliniennutzerlabels so vor:

      1. Klicken Sie auf Label hinzufügen und geben Sie im Feld Schlüssel einen Namen für den . Labelnamen müssen mit einem Kleinbuchstaben beginnen und können Kleinbuchstaben, Ziffern, Unterstriche und Bindestriche enthalten. Geben Sie beispielsweise severity ein.
      2. Klicken Sie auf Wert und geben Sie einen Wert für das Label ein. Labelwerte dürfen Kleinbuchstaben, Ziffern, Unterstriche und Bindestriche enthalten. Geben Sie beispielsweise critical ein.

      Informationen dazu, wie Sie Richtlinienlabels zur Verwaltung Ihrer Benachrichtigungen verwenden können, finden Sie unter Vorfälle mit Labels versehen.

  7. Optional: Geben Sie im Abschnitt Dokumentation alle Inhalte ein, die in der Benachrichtigung enthalten sein sollen.

    Zur Formatierung Ihrer Dokumentation können Sie nur Text verwenden, Markdown und Variablen. Sie können auch Links hinzufügen, die Nutzern bei der Fehlerbehebung helfen, z. B. Links zu internen Playbooks, Google Cloud-Dashboards und externen Seiten. In der folgenden Dokumentationsvorlage wird beispielsweise ein CPU-Nutzungsvorfall für eine gce_instance-Ressource beschrieben. Sie enthält mehrere Variablen, die auf die REST-Ressourcen für Benachrichtigungsrichtlinien und Bedingungen verweisen. Dokumentationsvorlage leitet die Leser dann zur Fehlerbehebung auf externe Seiten weiter.

    Beim Erstellen von Benachrichtigungen ersetzt das Monitoring-System die Variablen in der Dokumentation durch ihre Werte. Die Werte ersetzen die Variablen nur in Benachrichtigungen. Die Vorschaubereich und andere Stellen in der Google Cloud Console die Markdown-Formatierung anzuzeigen.

    Vorschau

    ## CPU utilization exceeded
    
    ### Summary
    
    The ${metric.display_name} of the ${resource.type}
    ${resource.label.instance_id} in the project ${resource.project} has
    exceeded 90% for over 15 minutes.
    
    ### Additional resource information
    
    Condition resource name: ${condition.name}  
    Alerting policy resource name: ${policy.name}  
    
    ### Troubleshooting and Debug References
    
    Repository with debug scripts: example.com  
    Internal troubleshooting guide: example.com  
    ${resource.type} dashboard: example.com
    

    Format in Benachrichtigung

    Beispiel für die Darstellung von Dokumenten in einer Benachrichtigung

    Weitere Informationen finden Sie unter Benachrichtigungen mit benutzerdefinierter Dokumentation ergänzen und Kanalsteuerelemente verwenden.

  8. Klicken Sie auf Name der Benachrichtigung und geben Sie einen Namen für die Benachrichtigungsrichtlinie ein.

  9. Klicken Sie auf Richtlinie erstellen.

Ausgewählte Zeitreihe filtern

Filter stellen sicher, dass nur Zeitreihen, die bestimmte Kriterien erfüllen, überwacht. Wenn Sie Filter anwenden, können Sie die Anzahl der Linien im Diagramm reduzieren, was die Leistung des Diagramms verbessern kann. Durch Aggregation können Sie die Menge der zu überwachenden Daten auch reduzieren. Filter stellen sicher, dass nur Zeitachsen verwendet werden, die bestimmte Kriterien erfüllen. Wenn Sie Filter anwenden, müssen weniger Zeitreihen ausgewertet werden, was die Leistung der Benachrichtigung verbessern kann.

Ein Filter besteht aus einem Label, einem Vergleichsoperator und einem Wert. Beispiel: für alle Zeitreihen, deren zone-Label mit "us-central1" beginnt, Filter zone=~"us-central1.*", der einen regulären Ausdruck verwendet um den Vergleich durchzuführen.

Wenn Sie nach der Projekt-ID oder dem Ressourcencontainer filtern, müssen Sie den Gleichheitsoperator (=) verwenden. Wenn Sie nach anderen Labels filtern, können Sie jeden unterstützten Vergleichsoperator verwenden. Normalerweise können Sie nach Messwert- und Ressourcenlabels sowie nach Ressourcengruppe filtern.

Wenn Sie mehrere Filterkriterien angeben, werden nur die Zeitreihen überwacht, die alle Kriterien erfüllen.

Um einen Filter hinzuzufügen, klicken Sie auf Filter hinzufügen, füllen Sie das Dialogfeld aus und klicken Sie dann auf Fertig. Im Dialogfeld wählen Sie über das Feld Filter die Kriterium, nach dem gefiltert werden soll, den Vergleichsoperator und wählen Sie den Wert aus. In jeder Zeile der folgenden Tabelle sind ein Vergleichsoperator, seine Bedeutung und ein Beispiel aufgeführt:

OperatorBedeutungBeispiel
= Entsprechung resource.labels.zone = "us-central1-a"
!= Ungleichheit resource.labels.zone != "us-central1-a"
=~ Gleichheit mit regulärem Ausdruck2 monitoring.regex.full_match("^us.*")
!=~ Ungleichheit mit regulärem Ausdruck2 monitoring.regex.full_match("^us.*")
starts_with Wert beginnt mit resource.labels.zone = starts_with("us")
ends_with Wert endet mit resource.labels.zone = ends_with("b")
has_substring Wert enthält resource.labels.zone = has_substring("east")
one_of Eine von resource.labels.zone = one_of("asia-east1-b", "europe-north1-a")
!starts_with Wert beginnt nicht mit resource.labels.zone != starts_with("us")
!ends_with Wert endet nicht mit resource.labels.zone != ends_with("b")
!has_substring Wert enthält nicht resource.labels.zone != has_substring("east")
!one_of Wert ist keiner der folgenden Werte resource.labels.zone != one_of("asia-east1-b", "europe-north1-a")

Fehlerbehebung

Dieser Abschnitt enthält Tipps zur Fehlerbehebung.

Messwert ist nicht im Menü der verfügbaren Messwerte aufgeführt

Wenn Sie einen Messwert überwachen möchten, der nicht im Menü Messwert auswählen aufgeführt ist, gehen Sie so vor:

  • Wenn Sie eine Benachrichtigungsrichtlinie erstellen möchten, die einen Google Cloud-Messwert überwacht, maximieren Sie das Menü Messwert auswählen und klicken Sie dann auf  Aktiv. Wenn diese Option deaktiviert ist, werden im Menü alle Messwerte für Google Cloud-Dienste und alle Messwerte mit Daten aufgeführt.

  • Um eine Bedingung für einen benutzerdefinierten Messwerttyp vor diesem Messwert zu konfigurieren -Typ Daten generiert, müssen Sie den Messwerttyp mithilfe eines Monitoring filter:

    1. Wählen Sie ? aus. in der Abschnittsüberschrift Messwert wählen und wählen Sie dann in der Kurzinfo Direkter Filtermodus aus.
    2. Geben Sie einen Monitoringfilter oder eine Zeitreihenauswahl ein. Informationen zur Syntax finden Sie in den folgenden Dokumenten:

Änderungsrate beobachten

Wenn Sie die Änderungsrate eines Messwerts beobachten möchten, legen Sie für das Feld Rollierende Fensterfunktion die Option Prozentuale Änderung fest. Wenn die Bedingung ausgewertet wird, berechnet Monitoring die Änderungsrate des Messwerts als Prozentsatz und vergleicht diesen Prozentsatz mit dem Schwellenwert der Bedingung. Dieser Vergleich umfasst zwei Schritte:

  1. Hat die Zeitreihe die Messwertart DELTA oder CUMULATIVE, dann gilt: wird die Zeitachse in eine Zeitachse mit der Messwertart GAUGE konvertiert. Weitere Informationen zum Weitere Informationen finden Sie unter Arten, Typen und Conversions.
  2. Beim Monitoring wird der Prozentsatz der Änderung berechnet, indem der Durchschnittswert im letzten 10-Minuten-Bewegungsfenster mit dem Durchschnittswert aus dem 10-Minuten-Bewegungsfenster vor Beginn des Kalibrierungszeitraums verglichen wird.

Sie können das gleitende Zeitfenster von 10 Minuten, das für Vergleiche verwendet wird, nicht in eine Benachrichtigungsrichtlinie für Änderungsraten verwendet wird. Sie geben den Ausrichtungszeitraum jedoch beim Erstellen der Bedingung an.

Nächste Schritte