Ereignistypen

In diesem Dokument werden die Ereignistypen beschrieben, die in Diagrammen als Annotationen angezeigt werden können. Ein Ereignis ist eine Aktivität, z. B. ein Neustart oder ein Absturz, die sich auf den Betrieb eines Systems auswirkt. Wenn Sie Ereignisse anzeigen lassen, können Sie bei der Fehlerbehebung Daten aus verschiedenen Quellen leichter korrelieren.

Für jedes Ereignis werden Links zu Referenzen oder die Dokumentation zur Fehlerbehebung sowie Informationen dazu bereitgestellt, wie das Ereignis abgefragt werden kann. Wenn beispielsweise Ereignisse durch die Analyse Ihrer Logs identifiziert werden, wird eine Abfrage bereitgestellt, die sich zur Verwendung mit dem Log-Explorer oder mit einer logbasierten Benachrichtigungsrichtlinie eignet.

Um Ihren Diagrammen Anmerkungen hinzuzufügen, konfigurieren Sie das Dashboard oder den Tab, auf dem das Diagramm angezeigt wird. Sie können beispielsweise die meisten Dashboards, die auf der Seite Dashboards der Google Cloud Console aufgeführt sind, so konfigurieren, dass Ereignisse angezeigt werden. Ebenso können Sie einige dienstspezifische Tabs für die Beobachtbarkeit konfigurieren, z. B. für Compute Engine und Google Kubernetes Engine, um Ereignisse anzuzeigen. Informationen zur Konfiguration finden Sie unter Ereignisse in einem Dashboard anzeigen.

Der folgende Screenshot zeigt ein Diagramm mit mehreren Ereignissen, die durch die Analyse von Logeinträgen identifiziert wurden, und einem Service Health-Ereignis:

Diagramm mit Hinweisen zu Warn- und Informationsereignissen.

Jede Anmerkung kann mehrere Ereignisse enthalten. Im vorherigen Screenshot ist ein Ereignis für eine GKE-Bereitstellung aufgeführt.

Ereignistypen für Benachrichtigungen

In diesem Abschnitt werden die Benachrichtigungsereignistypen beschrieben, die auf einem Dashboard angezeigt werden können.

Benachrichtigung geöffnet

Ereignisse, bei denen eine Benachrichtigung geöffnet ist, helfen Ihnen dabei, die Diagrammdaten dem Zeitpunkt, zu dem Vorfälle geöffnet wurden, in Beziehung zu setzen. Ein Ereignis, das eine Benachrichtigung geöffnet hat, wird angezeigt, wenn die folgenden Bedingungen erfüllt sind:

  • Der entsprechende Vorfall wurde während des vom Dashboard angegebenen Zeitraums geöffnet.
  • Der entsprechende Vorfall ist nicht geschlossen.

Für Vorfälle, die außerhalb des vom Dashboard angegebenen Zeitraums geöffnet wurden, werden keine Annotationen angezeigt. Ebenso wird ein Ereignis, bei dem eine Benachrichtigung geöffnet wurde, nicht angezeigt, wenn der entsprechende Vorfall geöffnet und dann innerhalb des vom Dashboard angegebenen Zeitraums geschlossen wird.

Die Kurzinfo für ein Ereignis, das eine Benachrichtigung geöffnet hat, enthält Folgendes:

  • Name der Benachrichtigungsrichtlinie.
  • Zusammenfassende Informationen, sofern diese Informationen verfügbar sind. Diese Informationen können beispielsweise den Schwellenwert und den gemessenen Wert umfassen.
  • Die Dauer des Vorfalls sowie Datum und Uhrzeit, zu der er geöffnet wurde.
  • Messwert- und Ressourcenlabels. In der Kurzinfo werden möglicherweise nicht alle Labels angezeigt.
  • Eine Schaltfläche Anzeigen, über die die Seite Details für den Vorfall geöffnet wird

Google Kubernetes Engine-Ereignistypen

In diesem Abschnitt werden die Google Kubernetes Engine-Ereignistypen beschrieben, die in einem Dashboard angezeigt werden können.

Gepatchte oder aktualisierte GKE-Arbeitslast

Mit diesem Ereignistyp können Sie Fehler bei der GKE-Arbeitslastbereitstellung oder bei Änderungen an Statefulset beheben, da diese Ereignisse mit Leistungsabfällen oder anderen Leistungsproblemen korrelieren können. Dieser Ereignistyp wird angezeigt, wenn eine Arbeitslast erstellt, aktualisiert oder gelöscht wird.

Wenn Sie für diesen Ereignistyp eine logbasierte Benachrichtigungsrichtlinie erstellen möchten, verwenden Sie die folgende Abfrage:

resource.type=k8s_cluster protoPayload.methodName=(
    io.k8s.apps.v1.deployments.create OR io.k8s.apps.v1.deployments.patch OR
    io.k8s.apps.v1.deployments.update OR io.k8s.apps.v1.deployments.delete OR
    io.k8s.apps.v1.deployments.deletecollection OR io.k8s.apps.v1.statefulsets.create OR
    io.k8s.apps.v1.statefulsets.patch OR io.k8s.apps.v1.statefulsets.update OR
    io.k8s.apps.v1.statefulsets.delete OR io.k8s.apps.v1.statefulsets.deletecollection OR
    io.k8s.apps.v1.daemonsets.create OR io.k8s.apps.v1.daemonsets.patch OR
    io.k8s.apps.v1.daemonsets.update OR io.k8s.apps.v1.daemonsets.delete OR
    io.k8s.apps.v1.daemonsets.deletecollection
)
-protoPayload.authenticationInfo.principalEmail="system:addon-manager"
-protoPayload.request.metadata.namespace=(kube-system OR gmp-system OR gmp-public OR gke-gmp-system)

Weitere Informationen finden Sie unter Arbeitslasten bereitstellen – Übersicht und Beobachtbarkeitsmesswerte ansehen.

Absturz eines GKE-Pods

Mit diesem Ereignistyp können Sie GKE-Pod-Abstürze leichter erkennen und beheben. Pod-Abstürze können durch Speicherausschöpfung oder einen Anwendungsfehler verursacht werden. Dieser Ereignistyp wird in folgenden Fällen angezeigt:

  • Pod-Status ist CrashLoopBackoff
  • Der Pod endet mit einem Exit-Code ungleich null.
  • Der Pod endet mit einer Bedingung des unzureichenden Arbeitsspeichers.
  • Pod wurde entfernt.
  • Bereitschafts-/Aktivitätsprüfung schlägt fehl.

Wenn Sie für diesen Ereignistyp eine logbasierte Benachrichtigungsrichtlinie erstellen möchten, verwenden Sie die folgende Abfrage:

(
    log_id(events)
    (
        (resource.type=k8s_pod jsonPayload.reason=(BackOff OR Unhealthy OR Killing OR Evicted)) OR
        (resource.type=k8s_node jsonPayload.reason=OOMKilling)
    )
    severity=WARNING
) OR (
    log_id(cloudaudit.googleapis.com%2Factivity) resource.type=k8s_cluster
    (protoPayload.methodName=io.k8s.core.v1.pods.eviction.create OR
        (protoPayload.methodName=io.k8s.core.v1.pods.delete
        protoPayload.response.status.containerStatuses.state.terminated.exitCode:*
        -protoPayload.response.status.containerStatuses.state.terminated.exitCode=0
        )
    )
)

Informationen zur Fehlerbehebung finden Sie unter Fehlerbehebung: CrashLoopBackOff.

Fehler beim Planen eines GKE-Pods

Mit diesem Ereignistyp können Sie ermitteln, wann Pods, die nicht auf einem Knoten geplant werden können, ermittelt und Fehler behoben werden können. Dieser Ereignistyp wird angezeigt, wenn die Pod-Planung aus einem der folgenden Gründe fehlschlägt:

  • Unzureichende Knoten-CPU.
  • Nicht genügend Knotenarbeitsspeicher.
  • Keine Knoten für Markierungen oder Toleranzen.
  • Knoten mit dem maximalen Pod-Limit.
  • Knotenpool mit maximaler Größe.

Wenn Sie für diesen Ereignistyp eine logbasierte Benachrichtigungsrichtlinie erstellen möchten, verwenden Sie die folgende Abfrage:

(
    log_id(events) resource.type=k8s_pod jsonPayload.reason=(NotTriggerScaleUp OR FailedScheduling)
) OR (
    log_id(container.googleapis.com/cluster-autoscaler-visibility)
    resource.type=k8s_cluster jsonPayload.noDecisionStatus.noScaleUp:*
)

Informationen zur Fehlerbehebung finden Sie unter Fehlerbehebung: Pod nicht planbar.

Fehler beim Erstellen eines GKE-Containers

Mit diesem Ereignistyp können Sie Fehler beim Erstellen eines GKE-Containers ermitteln und beheben. Das Erstellen von Containern kann verschiedene Ursachen haben, z. B. fehlgeschlagene Volume-Bereitstellungen oder fehlgeschlagene Image-Abrufe.

Wenn Sie für diesen Ereignistyp eine logbasierte Benachrichtigungsrichtlinie erstellen möchten, verwenden Sie die folgende Abfrage:

log_id(events) resource.type=k8s_pod jsonPayload.reason=(Failed OR FailedMount) severity=WARNING

Informationen zur Fehlerbehebung finden Sie unter Fehlerbehebung: ImagePullBackOff und ErrImagePull.

Pod-Autoscaling nach oben und unten skalieren

Dieses Ereignis gibt Ihnen Einblick in horizontale Pod-Autoscaling-Neuskalierungen, die die Anzahl der ausgeführten Pods für eine Arbeitslast erhöhen oder verringern. Weitere Informationen finden Sie unter Horizontales Pod-Autoscaling.

Wenn Sie für diesen Ereignistyp eine logbasierte Benachrichtigungsrichtlinie erstellen möchten, verwenden Sie die folgende Abfrage:

resource.type=k8s_cluster log_id(events)
jsonPayload.involvedObject.kind=HorizontalPodAutoscaler jsonPayload.reason=SuccessfulRescale

Cluster Autoscaler zum Hoch- und Herunterskalieren

Dieses Ereignis gibt Aufschluss darüber, wann die Anzahl der Knoten in einem Knotenpool Ihres Clusters von Cluster Autoscaler hoch- oder herunterskaliert wird. Weitere Informationen finden Sie unter Cluster-Autoscaling und Cluster Autoscaler-Ereignisse ansehen.

Wenn Sie für diesen Ereignistyp eine logbasierte Benachrichtigungsrichtlinie erstellen möchten, verwenden Sie die folgende Abfrage:

(resource.type=k8s_cluster log_id(container.googleapis.com%2Fcluster-autoscaler-visibility)
jsonPayload.decision:*)

Cluster erstellen und löschen

Dieses Ereignis verfolgt das Erstellen und Löschen von GKE-Cluster. Weitere Informationen finden Sie unter Autopilot-Cluster erstellen, Zonalen Cluster erstellen und Cluster löschen.

Wenn Sie für diesen Ereignistyp eine logbasierte Benachrichtigungsrichtlinie erstellen möchten, verwenden Sie die folgende Abfrage:

resource.type=gke_cluster log_id(cloudaudit.googleapis.com%2Factivity)
protoPayload.methodName=(
    google.container.v1alpha1.ClusterManager.CreateCluster OR
    google.container.v1beta1.ClusterManager.CreateCluster OR
    google.container.v1.ClusterManager.CreateCluster OR
    google.container.v1alpha1.ClusterManager.DeleteCluster OR
    google.container.v1beta1.ClusterManager.DeleteCluster OR
    google.container.v1.ClusterManager.DeleteCluster
)
operation.first=true

Clusteraktualisierung

Dieses Ereignis verfolgt GKE-Clusterupdates. Updates umfassen automatische und manuelle Versionsupgrades der Steuerungsebene sowie Änderungen der Clusterkonfiguration. Weitere Informationen finden Sie unter Manuelles Upgrade eines Clusters oder Knotenpools und Standard-Clusterupgrades.

Wenn Sie für diesen Ereignistyp eine logbasierte Benachrichtigungsrichtlinie erstellen möchten, verwenden Sie die folgende Abfrage:

resource.type=gke_cluster log_id(cloudaudit.googleapis.com%2Factivity)
(
    protoPayload.methodName=(
        google.container.internal.ClusterManagerInternal.PatchCluster OR
        google.container.internal.ClusterManagerInternal.UpdateClusterInternal OR
        google.container.internal.ClusterManagerInternal.UpdateCluster
    )
) OR (
    protoPayload.methodName=(
        google.container.v1beta1.ClusterManager.UpdateCluster OR
        google.container.v1.ClusterManager.UpdateCluster
    )
    operation.first=true
)
protoPayload.metadata.operationType=(UPGRADE_MASTER OR REPAIR_CLUSTER OR UPDATE_CLUSTER)

Knotenpoolupdate

Dieses Ereignis verfolgt Updates von GKE-Knotenpools. Updates umfassen automatische und manuelle Versionsupgrades von Knotenpools sowie Konfigurationsänderungen und Größenanpassungen. Weitere Informationen finden Sie unter Manuelles Upgrade eines Clusters oder Knotenpools und Standard-Clusterupgrades.

Wenn Sie für diesen Ereignistyp eine logbasierte Benachrichtigungsrichtlinie erstellen möchten, verwenden Sie die folgende Abfrage:

resource.type=gke_nodepool log_id(cloudaudit.googleapis.com%2Factivity)
(
    protoPayload.methodName=(
        google.container.internal.ClusterManagerInternal.UpdateClusterInternal OR
        google.container.internal.ClusterManagerInternal.RepairNodePool
    )
) OR (
    protoPayload.methodName=(
        google.container.v1beta1.ClusterManager.UpdateNodePool OR
        google.container.v1.ClusterManager.UpdateNodePool OR
        google.container.v1beta1.ClusterManager.SetNodePoolSize OR
        google.container.v1.ClusterManager.SetNodePoolSize OR
        google.container.v1beta1.ClusterManager.SetNodePoolManagement OR
        google.container.v1.ClusterManager.SetNodePoolManagement OR
        google.container.v1beta1.ClusterManager.SetNodePoolAutoscaling OR
        google.container.v1.ClusterManager.SetNodePoolAutoscaling
    )
    operation.first=true
)

Cloud Run-Ereignistypen

In diesem Abschnitt werden die Cloud Run-Ereignistypen beschrieben, die auf einem Dashboard angezeigt werden können.

Cloud Run-Bereitstellung

Mit diesem Ereignistyp können Sie Cloud Run-Bereitstellungsfehler ermitteln und beheben. Die Bereitstellung kann aus Gründen wie gelöschtem Dienstkonto, falschen Berechtigungen, fehlgeschlagenem Import eines Containers oder Fehler beim Starten eines Containers fehlschlagen.

Wenn Sie für diesen Ereignistyp eine logbasierte Benachrichtigungsrichtlinie erstellen möchten, verwenden Sie die folgende Abfrage:

log_id(cloudaudit.googleapis.com%2Factivity) resource.type=cloud_run_revision
protoPayload.methodName=google.cloud.run.v1.Services.ReplaceService

Informationen zur Fehlerbehebung finden Sie unter Fehlerbehebung: Cloud Run-Probleme.

Cloud SQL-Ereignistypen

In diesem Abschnitt werden die Cloud SQL-Ereignistypen beschrieben, die in einem Dashboard angezeigt werden können.

Cloud SQL-Failover

Mit diesem Ereignistyp können Sie ermitteln, wann manuelle oder automatische Failovers auftreten. Ein Failover tritt auf, wenn eine Instanz oder Zone ausfällt und die Standby-Instanz zur neuen primären Instanz wird. Während eines Failovers schaltet Cloud SQL automatisch auf die Bereitstellung von Daten aus der Standby-Instanz um.

Wenn Sie für diesen Ereignistyp eine logbasierte Benachrichtigungsrichtlinie erstellen möchten, verwenden Sie die folgende Abfrage:

resource.type=cloudsql_database
(
    (
        log_id(cloudaudit.googleapis.com%2Factivity)
        protoPayload.methodName=cloudsql.instances.failover
        operation.last=true
    ) OR (
        log_id(cloudaudit.googleapis.com%2Fsystem_event)
        protoPayload.methodName=cloudsql.instances.autoFailover
    )
)

Weitere Informationen finden Sie unter Informationen zur Hochverfügbarkeit.

Cloud SQL starten oder beenden

Mit diesem Ereignistyp können Sie feststellen, ob eine Cloud SQL-Instanz manuell gestartet, beendet oder neu gestartet wurde. Wenn eine Instanz beendet wird, werden auch alle Verbindungen, geöffneten Dateien und laufenden Vorgänge beendet.

Wenn Sie für diesen Ereignistyp eine logbasierte Benachrichtigungsrichtlinie erstellen möchten, verwenden Sie die folgende Abfrage:

log_id(cloudaudit.googleapis.com%2Factivity) resource.type=cloudsql_database
protoPayload.methodName=cloudsql.instances.update operation.last=true
protoPayload.metadata.intents.intent=(START_INSTANCE OR STOP_INSTANCE)

Weitere Informationen finden Sie unter Informationen zur Hochverfügbarkeit und Instanzen starten, beenden und neu starten.

Cloud SQL-Speicher

Mit diesem Ereignistyp können Sie Ereignisse im Zusammenhang mit dem Cloud SQL-Speicher identifizieren, z. B. wenn der Datenbankspeicher voll ist oder wenn eine Datenbank aufgrund ausgeschöpfter Speicherkapazität heruntergefahren wird. Datenbanken mit ausgeschöpfter Speicherkapazität und ohne aktivierte automatische Speicherung werden möglicherweise heruntergefahren, um Datenbeschädigungen zu vermeiden.

Wenn Sie für diesen Ereignistyp eine logbasierte Benachrichtigungsrichtlinie erstellen möchten, verwenden Sie die folgende Abfrage:

resource.type=cloudsql_database
(
    (
        (log_id(cloudsql.googleapis.com%2Fpostgres.log) OR log_id(cloudsql.googleapis.com%2Fmysql.err))
        textPayload=~"No space left on device"
        severity=(ERROR OR EMERGENCY)
    ) OR (
        log_id(cloudaudit.googleapis.com%2Fsystem_event)
        protoPayload.methodName=cloudsql.instances.databaseShutdownOutOfStorage
    )
)

Compute Engine-Ereignistypen

In diesem Abschnitt werden die Compute Engine-Ereignistypen beschrieben, die auf einem Dashboard angezeigt werden können.

Beendigungen von virtuellen Maschinen

Mit diesem Ereignistyp können Sie Beendigungen von virtuellen Maschinen (VM) identifizieren, einschließlich manuell ausgelöster Zurücksetzungen und Stopps, Beendigungen von Gastbetriebssystemen, Wartungsbeendigungen und Hostfehlern.

Wenn Sie für diesen Ereignistyp eine logbasierte Benachrichtigungsrichtlinie erstellen möchten, verwenden Sie die folgende Abfrage:

resource.type=gce_instance
(
    (
        log_id(cloudaudit.googleapis.com%2Factivity)
        protoPayload.methodName=(
            beta.compute.instances.reset OR v1.compute.instances.reset OR
            beta.compute.instances.stop OR v1.compute.instances.stop
        )
        operation.first=true
    ) OR (
        log_id(cloudaudit.googleapis.com%2Fsystem_event)
        protoPayload.methodName=(
            compute.instances.hostError OR
            compute.instances.guestTerminate OR
            compute.instances.terminateOnHostMaintenance
        )
    )
)

Weitere Informationen finden Sie unter VM beenden und starten und Fehlerbehebung beim Herunterfahren und Neustarten von VMs.

Fehler beim Start der VM-Instanz

Dieses Ereignis verfolgt Fehler beim Starten von Compute Engine-VM-Instanzen. Das Ereignis zeigt Startfehler aufgrund von Ressourcenmangel, Erschöpfung des IP-Bereichs, überschrittenem Kontingent oder Shielded VM-Integritätsfehlern an.

Wenn Sie für diesen Ereignistyp eine logbasierte Benachrichtigungsrichtlinie erstellen möchten, verwenden Sie die folgende Abfrage:

resource.type=gce_instance
(
    (
        log_id(cloudaudit.googleapis.com%2Factivity)
        protoPayload.methodName=(beta.compute.instances.insert OR v1.compute.instances.insert)
        protoPayload.status.message=(ZONE_RESOURCE_POOL_EXHAUSTED OR IP_SPACE_EXHAUSTED OR QUOTA_EXCEEDED)
    ) OR (
        log_id(compute.googleapis.com%2Fshielded_vm_integrity)
        severity="ERROR"
    )
)

Fehler im Gastbetriebssystem der VM-Instanz

Dieses Ereignis verfolgt bestimmte Gastbetriebssystemfehler der Compute Engine-VM-Instanz, wie in den Logs der seriellen Konsole aufgezeichnet. Zu den erfassten Fehlern gehören volles Laufwerk, fehlgeschlagene Bereitstellung des Dateisystems und Startfehler, durch die der Linux-Notfallmodus aktiviert wird.

Damit diese Ereignisse sichtbar sind, müssen Sie das Logging für die Ausgabe des seriellen Ports in Cloud Logging aktivieren. Dazu legen Sie in der VM oder in den Projektmetadaten serial-port-logging-enable=true fest. Weitere Informationen finden Sie unter Logging für die Ausgabe des seriellen Ports aktivieren und deaktivieren.

Wenn Sie für diesen Ereignistyp eine logbasierte Benachrichtigungsrichtlinie erstellen möchten, verwenden Sie die folgende Abfrage:

resource.type=gce_instance
log_id(serialconsole.googleapis.com%2Fserial_port_1_output)
textPayload=~("No space left on device" OR "Failed to mount" OR "You are in emergency mode")

Aktualisierung der verwalteten Instanzgruppe

Mit diesem Ereignistyp können Sie feststellen, wann Ihre verwaltete Instanzgruppe aktualisiert wurde. Beispielsweise wurden VMs hinzugefügt oder entfernt oder die Größenbeschränkung wurde aktualisiert. Weitere Informationen finden Sie unter Aktualisierungen der VM-Konfiguration in einer MIG automatisch anwenden.

Wenn Sie für diesen Ereignistyp eine logbasierte Benachrichtigungsrichtlinie erstellen möchten, verwenden Sie die folgende Abfrage:

resource.type=gce_instance_group_manager
log_id(cloudaudit.googleapis.com%2Factivity) operation.first=true
protoPayload.methodName=(beta.compute.instanceGroupManagers.patch OR v1.compute.instanceGroupManagers.patch)

Weitere Informationen finden Sie unter Mit verwalteten Instanzen arbeiten und Fehlerbehebung bei verwalteten Instanzgruppen.

Autoscaling für verwaltete Instanzgruppen

Dieses Ereignis verfolgt Skalierungsentscheidungen, die vom Autoscaling einer verwalteten Instanzgruppe getroffen wurden. Diese Entscheidungen können Änderungen an der empfohlenen Größe für eine verwaltete Instanzgruppe oder eine Statusänderung des Autoscalings selbst umfassen. Weitere Informationen finden Sie unter Autoscaling von Instanzgruppen.

Wenn Sie für diesen Ereignistyp eine logbasierte Benachrichtigungsrichtlinie erstellen möchten, verwenden Sie die folgende Abfrage:

resource.type=autoscaler log_id(cloudaudit.googleapis.com%2Fsystem_event)
protoPayload.methodName=(compute.autoscalers.resize OR compute.autoscalers.changeStatus)

Ereignistypen für Personalized Service Health

In diesem Abschnitt werden die Personalized Service Health-Typen beschrieben, die in einem Dashboard angezeigt werden können.

Google Cloud-Vorfall

Bei der Fehlerbehebung sollten Sie zwischen Fehlern unterscheiden, die von einem eigenen Dienst und einem von einem von Ihnen verwendeten Google Cloud-Dienst verursacht werden. Wenn Sie Personalized Service Health-Annotationen in einem Dashboard aktivieren, können Sie Unterbrechungen oder Dienststatusereignisse für Google Cloud-Dienste aufrufen. Eine Liste der in Service Health eingebundenen Dienste finden Sie unter Unterstützte Google-Produkte.

Im Gegensatz zu anderen Ereignistypen werden Google Cloud-Vorfälle nicht durch die Analyse Ihrer Logeinträge identifiziert. Wenn Sie bei diesen Ereignissen benachrichtigt werden möchten, müssen Sie eine Benachrichtigungsrichtlinie erstellen. Sie können eine vorkonfigurierte Benachrichtigungsrichtlinie mithilfe der Optionen auf der Seite Service Health-Dashboard auswählen. Weitere Informationen finden Sie unter Kurzanleitung: Benachrichtigung einrichten.

Monitoring identifiziert Google Cloud-Vorfälle, indem es eine Anfrage an die Service Health API sendet und dann die Antwort auf Vorfälle filtert, die für die angezeigten Daten relevant sind. Die Anfrage hat die folgende Konfiguration:

  • Die Aufzählung Relevance ist auf RELATED, IMPACTED oder PARTIALLY_RELATED festgelegt. Durch diese Einschränkung wird sichergestellt, dass im Dashboard nur Ereignisse für die Google Cloud-Dienste angezeigt werden, die von Ihrem Google Cloud-Projekt verwendet werden.

  • Die Aufzählung DetailedState ist nicht auf FALSE_POSITIVE festgelegt.

Service Health-Annotationen werden mit einer Startzeit und einer Dauer angezeigt. Die Dauer wird durch Ändern der Hintergrundfarbe des Diagramms angezeigt. Die Kurzinfo für einen Google Cloud-Vorfall enthält Folgendes:

  • Der Google Cloud-Dienst.
  • Ob der Vorfall offen oder behoben ist
  • Datum und Startzeit des Ereignisses.
  • Chips, die die Anzahl der betroffenen Produkte und Standorte anzeigen. Wenn Sie die betroffenen Produkte oder Standorte auflisten möchten, platzieren Sie den Mauszeiger auf dem entsprechenden Chip.
  • Eine Schaltfläche View (Ansicht), die die Detailseite für den Vorfall öffnet.

Informationen zum Senden einer Anfrage an die Service Health API finden Sie unter Mit Service Health auf Unterbrechungen prüfen.

Informationen zur Fehlerbehebung finden Sie unter Häufige Probleme in Service Health beheben.

Ereignistypen für Verfügbarkeitsdiagnosen

In diesem Abschnitt werden die Ereignistypen für Verfügbarkeitsdiagnosen beschrieben, die in einem Dashboard angezeigt werden können.

Verfügbarkeitsdiagnose fehlgeschlagen

Mit diesem Ereignistyp können Sie Fehler bei Verfügbarkeitsdiagnosen in konfigurierten Regionen identifizieren.

Wenn Sie für diesen Ereignistyp eine logbasierte Benachrichtigungsrichtlinie erstellen möchten, verwenden Sie die folgende Abfrage:

log_id(monitoring.googleapis.com%2Fuptime_checks)
(
  resource.type=uptime_url OR resource.type=gce_instance OR
  resource.type=gae_app OR resource.type=k8s_service OR
  resource.type=servicedirectory_service OR resource.type=cloud_run_revision OR
  resource.type=aws_ec2_instance OR resource.type=aws_elb_load_balancer
)
labels.uptime_result_type=UptimeCheckResult
severity=NOTICE

Informationen zur Fehlerbehebung finden Sie unter Fehler beim synthetischen Monitoring und Verfügbarkeitsdiagnosen beheben.

Nächste Schritte

Informationen zum Anzeigen von Ereignissen auf Ihren Dashboards finden Sie unter Ereignisse in einem Dashboard anzeigen.