In diesem Dokument werden die Ereignistypen beschrieben, die in Diagrammen als Annotationen angezeigt werden können. Ein Ereignis ist eine Aktivität, z. B. ein Neustart oder ein Absturz, die sich auf den Betrieb eines Systems auswirkt. Wenn Sie Ereignisse anzeigen lassen, können Sie bei der Fehlerbehebung Daten aus verschiedenen Quellen leichter korrelieren.
Für jedes Ereignis werden Links zu Referenzen oder die Dokumentation zur Fehlerbehebung sowie Informationen dazu bereitgestellt, wie das Ereignis abgefragt werden kann. Wenn beispielsweise Ereignisse durch die Analyse Ihrer Logs identifiziert werden, wird eine Abfrage bereitgestellt, die sich zur Verwendung mit dem Log-Explorer oder mit einer logbasierten Benachrichtigungsrichtlinie eignet.
Um Ihren Diagrammen Anmerkungen hinzuzufügen, konfigurieren Sie das Dashboard oder den Tab, auf dem das Diagramm angezeigt wird. Sie können beispielsweise die meisten Dashboards, die auf der Seite Dashboards der Google Cloud Console aufgeführt sind, so konfigurieren, dass Ereignisse angezeigt werden. Ebenso können Sie einige dienstspezifische Tabs für die Beobachtbarkeit konfigurieren, z. B. für Compute Engine und Google Kubernetes Engine, um Ereignisse anzuzeigen. Informationen zur Konfiguration finden Sie unter Ereignisse in einem Dashboard anzeigen.
Der folgende Screenshot zeigt ein Diagramm mit mehreren Ereignissen, die durch die Analyse von Logeinträgen identifiziert wurden, und einem Service Health-Ereignis:
Jede Anmerkung kann mehrere Ereignisse enthalten. Im vorherigen Screenshot ist ein Ereignis für eine GKE-Bereitstellung aufgeführt.
Ereignistypen für Benachrichtigungen
In diesem Abschnitt werden die Benachrichtigungsereignistypen beschrieben, die auf einem Dashboard angezeigt werden können.
Benachrichtigung geöffnet
Ereignisse, bei denen eine Benachrichtigung geöffnet ist, helfen Ihnen dabei, die Diagrammdaten dem Zeitpunkt, zu dem Vorfälle geöffnet wurden, in Beziehung zu setzen. Ein Ereignis, das eine Benachrichtigung geöffnet hat, wird angezeigt, wenn die folgenden Bedingungen erfüllt sind:
- Der entsprechende Vorfall wurde während des vom Dashboard angegebenen Zeitraums geöffnet.
- Der entsprechende Vorfall ist nicht geschlossen.
Für Vorfälle, die außerhalb des vom Dashboard angegebenen Zeitraums geöffnet wurden, werden keine Annotationen angezeigt. Ebenso wird ein Ereignis, bei dem eine Benachrichtigung geöffnet wurde, nicht angezeigt, wenn der entsprechende Vorfall geöffnet und dann innerhalb des vom Dashboard angegebenen Zeitraums geschlossen wird.
Die Kurzinfo für ein Ereignis, das eine Benachrichtigung geöffnet hat, enthält Folgendes:
- Name der Benachrichtigungsrichtlinie.
- Zusammenfassende Informationen, sofern diese Informationen verfügbar sind. Diese Informationen können beispielsweise den Schwellenwert und den gemessenen Wert umfassen.
- Die Dauer des Vorfalls sowie Datum und Uhrzeit, zu der er geöffnet wurde.
- Messwert- und Ressourcenlabels. In der Kurzinfo werden möglicherweise nicht alle Labels angezeigt.
- Eine Schaltfläche Anzeigen, über die die Seite Details für den Vorfall geöffnet wird
Google Kubernetes Engine-Ereignistypen
In diesem Abschnitt werden die Google Kubernetes Engine-Ereignistypen beschrieben, die in einem Dashboard angezeigt werden können.
Gepatchte oder aktualisierte GKE-Arbeitslast
Mit diesem Ereignistyp können Sie Fehler bei der GKE-Arbeitslastbereitstellung oder bei Änderungen an Statefulset beheben, da diese Ereignisse mit Leistungsabfällen oder anderen Leistungsproblemen korrelieren können. Dieser Ereignistyp wird angezeigt, wenn eine Arbeitslast erstellt, aktualisiert oder gelöscht wird.
Wenn Sie für diesen Ereignistyp eine logbasierte Benachrichtigungsrichtlinie erstellen möchten, verwenden Sie die folgende Abfrage:
resource.type=k8s_cluster protoPayload.methodName=( io.k8s.apps.v1.deployments.create OR io.k8s.apps.v1.deployments.patch OR io.k8s.apps.v1.deployments.update OR io.k8s.apps.v1.deployments.delete OR io.k8s.apps.v1.deployments.deletecollection OR io.k8s.apps.v1.statefulsets.create OR io.k8s.apps.v1.statefulsets.patch OR io.k8s.apps.v1.statefulsets.update OR io.k8s.apps.v1.statefulsets.delete OR io.k8s.apps.v1.statefulsets.deletecollection OR io.k8s.apps.v1.daemonsets.create OR io.k8s.apps.v1.daemonsets.patch OR io.k8s.apps.v1.daemonsets.update OR io.k8s.apps.v1.daemonsets.delete OR io.k8s.apps.v1.daemonsets.deletecollection ) -protoPayload.authenticationInfo.principalEmail="system:addon-manager" -protoPayload.request.metadata.namespace=(kube-system OR gmp-system OR gmp-public OR gke-gmp-system)
Weitere Informationen finden Sie unter Arbeitslasten bereitstellen – Übersicht und Beobachtbarkeitsmesswerte ansehen.
Absturz eines GKE-Pods
Mit diesem Ereignistyp können Sie GKE-Pod-Abstürze leichter erkennen und beheben. Pod-Abstürze können durch Speicherausschöpfung oder einen Anwendungsfehler verursacht werden. Dieser Ereignistyp wird in folgenden Fällen angezeigt:
- Pod-Status ist
CrashLoopBackoff
- Der Pod endet mit einem Exit-Code ungleich null.
- Der Pod endet mit einer Bedingung des unzureichenden Arbeitsspeichers.
- Pod wurde entfernt.
- Bereitschafts-/Aktivitätsprüfung schlägt fehl.
Wenn Sie für diesen Ereignistyp eine logbasierte Benachrichtigungsrichtlinie erstellen möchten, verwenden Sie die folgende Abfrage:
( log_id(events) ( (resource.type=k8s_pod jsonPayload.reason=(BackOff OR Unhealthy OR Killing OR Evicted)) OR (resource.type=k8s_node jsonPayload.reason=OOMKilling) ) severity=WARNING ) OR ( log_id(cloudaudit.googleapis.com%2Factivity) resource.type=k8s_cluster (protoPayload.methodName=io.k8s.core.v1.pods.eviction.create OR (protoPayload.methodName=io.k8s.core.v1.pods.delete protoPayload.response.status.containerStatuses.state.terminated.exitCode:* -protoPayload.response.status.containerStatuses.state.terminated.exitCode=0 ) ) )
Informationen zur Fehlerbehebung finden Sie unter Fehlerbehebung: CrashLoopBackOff.
Fehler beim Planen eines GKE-Pods
Mit diesem Ereignistyp können Sie ermitteln, wann Pods, die nicht auf einem Knoten geplant werden können, ermittelt und Fehler behoben werden können. Dieser Ereignistyp wird angezeigt, wenn die Pod-Planung aus einem der folgenden Gründe fehlschlägt:
- Unzureichende Knoten-CPU.
- Nicht genügend Knotenarbeitsspeicher.
- Keine Knoten für Markierungen oder Toleranzen.
- Knoten mit dem maximalen Pod-Limit.
- Knotenpool mit maximaler Größe.
Wenn Sie für diesen Ereignistyp eine logbasierte Benachrichtigungsrichtlinie erstellen möchten, verwenden Sie die folgende Abfrage:
( log_id(events) resource.type=k8s_pod jsonPayload.reason=(NotTriggerScaleUp OR FailedScheduling) ) OR ( log_id(container.googleapis.com/cluster-autoscaler-visibility) resource.type=k8s_cluster jsonPayload.noDecisionStatus.noScaleUp:* )
Informationen zur Fehlerbehebung finden Sie unter Fehlerbehebung: Pod nicht planbar.
Fehler beim Erstellen eines GKE-Containers
Mit diesem Ereignistyp können Sie Fehler beim Erstellen eines GKE-Containers ermitteln und beheben. Das Erstellen von Containern kann verschiedene Ursachen haben, z. B. fehlgeschlagene Volume-Bereitstellungen oder fehlgeschlagene Image-Abrufe.
Wenn Sie für diesen Ereignistyp eine logbasierte Benachrichtigungsrichtlinie erstellen möchten, verwenden Sie die folgende Abfrage:
log_id(events) resource.type=k8s_pod jsonPayload.reason=(Failed OR FailedMount) severity=WARNING
Informationen zur Fehlerbehebung finden Sie unter Fehlerbehebung: ImagePullBackOff und ErrImagePull.
Pod-Autoscaling nach oben und unten skalieren
Dieses Ereignis gibt Ihnen Einblick in horizontale Pod-Autoscaling-Neuskalierungen, die die Anzahl der ausgeführten Pods für eine Arbeitslast erhöhen oder verringern. Weitere Informationen finden Sie unter Horizontales Pod-Autoscaling.
Wenn Sie für diesen Ereignistyp eine logbasierte Benachrichtigungsrichtlinie erstellen möchten, verwenden Sie die folgende Abfrage:
resource.type=k8s_cluster log_id(events) jsonPayload.involvedObject.kind=HorizontalPodAutoscaler jsonPayload.reason=SuccessfulRescale
Cluster Autoscaler zum Hoch- und Herunterskalieren
Dieses Ereignis gibt Aufschluss darüber, wann die Anzahl der Knoten in einem Knotenpool Ihres Clusters von Cluster Autoscaler hoch- oder herunterskaliert wird. Weitere Informationen finden Sie unter Cluster-Autoscaling und Cluster Autoscaler-Ereignisse ansehen.
Wenn Sie für diesen Ereignistyp eine logbasierte Benachrichtigungsrichtlinie erstellen möchten, verwenden Sie die folgende Abfrage:
(resource.type=k8s_cluster log_id(container.googleapis.com%2Fcluster-autoscaler-visibility) jsonPayload.decision:*)
Cluster erstellen und löschen
Dieses Ereignis verfolgt das Erstellen und Löschen von GKE-Cluster. Weitere Informationen finden Sie unter Autopilot-Cluster erstellen, Zonalen Cluster erstellen und Cluster löschen.
Wenn Sie für diesen Ereignistyp eine logbasierte Benachrichtigungsrichtlinie erstellen möchten, verwenden Sie die folgende Abfrage:
resource.type=gke_cluster log_id(cloudaudit.googleapis.com%2Factivity) protoPayload.methodName=( google.container.v1alpha1.ClusterManager.CreateCluster OR google.container.v1beta1.ClusterManager.CreateCluster OR google.container.v1.ClusterManager.CreateCluster OR google.container.v1alpha1.ClusterManager.DeleteCluster OR google.container.v1beta1.ClusterManager.DeleteCluster OR google.container.v1.ClusterManager.DeleteCluster ) operation.first=true
Clusteraktualisierung
Dieses Ereignis verfolgt GKE-Clusterupdates. Updates umfassen automatische und manuelle Versionsupgrades der Steuerungsebene sowie Änderungen der Clusterkonfiguration. Weitere Informationen finden Sie unter Manuelles Upgrade eines Clusters oder Knotenpools und Standard-Clusterupgrades.
Wenn Sie für diesen Ereignistyp eine logbasierte Benachrichtigungsrichtlinie erstellen möchten, verwenden Sie die folgende Abfrage:
resource.type=gke_cluster log_id(cloudaudit.googleapis.com%2Factivity) ( protoPayload.methodName=( google.container.internal.ClusterManagerInternal.PatchCluster OR google.container.internal.ClusterManagerInternal.UpdateClusterInternal OR google.container.internal.ClusterManagerInternal.UpdateCluster ) ) OR ( protoPayload.methodName=( google.container.v1beta1.ClusterManager.UpdateCluster OR google.container.v1.ClusterManager.UpdateCluster ) operation.first=true ) protoPayload.metadata.operationType=(UPGRADE_MASTER OR REPAIR_CLUSTER OR UPDATE_CLUSTER)
Knotenpoolupdate
Dieses Ereignis verfolgt Updates von GKE-Knotenpools. Updates umfassen automatische und manuelle Versionsupgrades von Knotenpools sowie Konfigurationsänderungen und Größenanpassungen. Weitere Informationen finden Sie unter Manuelles Upgrade eines Clusters oder Knotenpools und Standard-Clusterupgrades.
Wenn Sie für diesen Ereignistyp eine logbasierte Benachrichtigungsrichtlinie erstellen möchten, verwenden Sie die folgende Abfrage:
resource.type=gke_nodepool log_id(cloudaudit.googleapis.com%2Factivity) ( protoPayload.methodName=( google.container.internal.ClusterManagerInternal.UpdateClusterInternal OR google.container.internal.ClusterManagerInternal.RepairNodePool ) ) OR ( protoPayload.methodName=( google.container.v1beta1.ClusterManager.UpdateNodePool OR google.container.v1.ClusterManager.UpdateNodePool OR google.container.v1beta1.ClusterManager.SetNodePoolSize OR google.container.v1.ClusterManager.SetNodePoolSize OR google.container.v1beta1.ClusterManager.SetNodePoolManagement OR google.container.v1.ClusterManager.SetNodePoolManagement OR google.container.v1beta1.ClusterManager.SetNodePoolAutoscaling OR google.container.v1.ClusterManager.SetNodePoolAutoscaling ) operation.first=true )
Cloud Run-Ereignistypen
In diesem Abschnitt werden die Cloud Run-Ereignistypen beschrieben, die auf einem Dashboard angezeigt werden können.
Cloud Run-Bereitstellung
Mit diesem Ereignistyp können Sie Cloud Run-Bereitstellungsfehler ermitteln und beheben. Die Bereitstellung kann aus Gründen wie gelöschtem Dienstkonto, falschen Berechtigungen, fehlgeschlagenem Import eines Containers oder Fehler beim Starten eines Containers fehlschlagen.
Wenn Sie für diesen Ereignistyp eine logbasierte Benachrichtigungsrichtlinie erstellen möchten, verwenden Sie die folgende Abfrage:
log_id(cloudaudit.googleapis.com%2Factivity) resource.type=cloud_run_revision protoPayload.methodName=google.cloud.run.v1.Services.ReplaceService
Informationen zur Fehlerbehebung finden Sie unter Fehlerbehebung: Cloud Run-Probleme.
Cloud SQL-Ereignistypen
In diesem Abschnitt werden die Cloud SQL-Ereignistypen beschrieben, die in einem Dashboard angezeigt werden können.
Cloud SQL-Failover
Mit diesem Ereignistyp können Sie ermitteln, wann manuelle oder automatische Failovers auftreten. Ein Failover tritt auf, wenn eine Instanz oder Zone ausfällt und die Standby-Instanz zur neuen primären Instanz wird. Während eines Failovers schaltet Cloud SQL automatisch auf die Bereitstellung von Daten aus der Standby-Instanz um.
Wenn Sie für diesen Ereignistyp eine logbasierte Benachrichtigungsrichtlinie erstellen möchten, verwenden Sie die folgende Abfrage:
resource.type=cloudsql_database ( ( log_id(cloudaudit.googleapis.com%2Factivity) protoPayload.methodName=cloudsql.instances.failover operation.last=true ) OR ( log_id(cloudaudit.googleapis.com%2Fsystem_event) protoPayload.methodName=cloudsql.instances.autoFailover ) )
Weitere Informationen finden Sie unter Informationen zur Hochverfügbarkeit.
Cloud SQL starten oder beenden
Mit diesem Ereignistyp können Sie feststellen, ob eine Cloud SQL-Instanz manuell gestartet, beendet oder neu gestartet wurde. Wenn eine Instanz beendet wird, werden auch alle Verbindungen, geöffneten Dateien und laufenden Vorgänge beendet.
Wenn Sie für diesen Ereignistyp eine logbasierte Benachrichtigungsrichtlinie erstellen möchten, verwenden Sie die folgende Abfrage:
log_id(cloudaudit.googleapis.com%2Factivity) resource.type=cloudsql_database protoPayload.methodName=cloudsql.instances.update operation.last=true protoPayload.metadata.intents.intent=(START_INSTANCE OR STOP_INSTANCE)
Weitere Informationen finden Sie unter Informationen zur Hochverfügbarkeit und Instanzen starten, beenden und neu starten.
Cloud SQL-Speicher
Mit diesem Ereignistyp können Sie Ereignisse im Zusammenhang mit dem Cloud SQL-Speicher identifizieren, z. B. wenn der Datenbankspeicher voll ist oder wenn eine Datenbank aufgrund ausgeschöpfter Speicherkapazität heruntergefahren wird. Datenbanken mit ausgeschöpfter Speicherkapazität und ohne aktivierte automatische Speicherung werden möglicherweise heruntergefahren, um Datenbeschädigungen zu vermeiden.
Wenn Sie für diesen Ereignistyp eine logbasierte Benachrichtigungsrichtlinie erstellen möchten, verwenden Sie die folgende Abfrage:
resource.type=cloudsql_database ( ( (log_id(cloudsql.googleapis.com%2Fpostgres.log) OR log_id(cloudsql.googleapis.com%2Fmysql.err)) textPayload=~"No space left on device" severity=(ERROR OR EMERGENCY) ) OR ( log_id(cloudaudit.googleapis.com%2Fsystem_event) protoPayload.methodName=cloudsql.instances.databaseShutdownOutOfStorage ) )
Compute Engine-Ereignistypen
In diesem Abschnitt werden die Compute Engine-Ereignistypen beschrieben, die auf einem Dashboard angezeigt werden können.
Beendigungen von virtuellen Maschinen
Mit diesem Ereignistyp können Sie Beendigungen von virtuellen Maschinen (VM) identifizieren, einschließlich manuell ausgelöster Zurücksetzungen und Stopps, Beendigungen von Gastbetriebssystemen, Wartungsbeendigungen und Hostfehlern.
Wenn Sie für diesen Ereignistyp eine logbasierte Benachrichtigungsrichtlinie erstellen möchten, verwenden Sie die folgende Abfrage:
resource.type=gce_instance ( ( log_id(cloudaudit.googleapis.com%2Factivity) protoPayload.methodName=( beta.compute.instances.reset OR v1.compute.instances.reset OR beta.compute.instances.stop OR v1.compute.instances.stop ) operation.first=true ) OR ( log_id(cloudaudit.googleapis.com%2Fsystem_event) protoPayload.methodName=( compute.instances.hostError OR compute.instances.guestTerminate OR compute.instances.terminateOnHostMaintenance ) ) )
Weitere Informationen finden Sie unter VM beenden und starten und Fehlerbehebung beim Herunterfahren und Neustarten von VMs.
Fehler beim Start der VM-Instanz
Dieses Ereignis verfolgt Fehler beim Starten von Compute Engine-VM-Instanzen. Das Ereignis zeigt Startfehler aufgrund von Ressourcenmangel, Erschöpfung des IP-Bereichs, überschrittenem Kontingent oder Shielded VM-Integritätsfehlern an.
Wenn Sie für diesen Ereignistyp eine logbasierte Benachrichtigungsrichtlinie erstellen möchten, verwenden Sie die folgende Abfrage:
resource.type=gce_instance ( ( log_id(cloudaudit.googleapis.com%2Factivity) protoPayload.methodName=(beta.compute.instances.insert OR v1.compute.instances.insert) protoPayload.status.message=(ZONE_RESOURCE_POOL_EXHAUSTED OR IP_SPACE_EXHAUSTED OR QUOTA_EXCEEDED) ) OR ( log_id(compute.googleapis.com%2Fshielded_vm_integrity) severity="ERROR" ) )
Fehler im Gastbetriebssystem der VM-Instanz
Dieses Ereignis verfolgt bestimmte Gastbetriebssystemfehler der Compute Engine-VM-Instanz, wie in den Logs der seriellen Konsole aufgezeichnet. Zu den erfassten Fehlern gehören volles Laufwerk, fehlgeschlagene Bereitstellung des Dateisystems und Startfehler, durch die der Linux-Notfallmodus aktiviert wird.
Damit diese Ereignisse sichtbar sind, müssen Sie das Logging für die Ausgabe des seriellen Ports in Cloud Logging aktivieren. Dazu legen Sie in der VM oder in den Projektmetadaten serial-port-logging-enable=true
fest. Weitere Informationen finden Sie unter Logging für die Ausgabe des seriellen Ports aktivieren und deaktivieren.
Wenn Sie für diesen Ereignistyp eine logbasierte Benachrichtigungsrichtlinie erstellen möchten, verwenden Sie die folgende Abfrage:
resource.type=gce_instance log_id(serialconsole.googleapis.com%2Fserial_port_1_output) textPayload=~("No space left on device" OR "Failed to mount" OR "You are in emergency mode")
Aktualisierung der verwalteten Instanzgruppe
Mit diesem Ereignistyp können Sie feststellen, wann Ihre verwaltete Instanzgruppe aktualisiert wurde. Beispielsweise wurden VMs hinzugefügt oder entfernt oder die Größenbeschränkung wurde aktualisiert. Weitere Informationen finden Sie unter Aktualisierungen der VM-Konfiguration in einer MIG automatisch anwenden.
Wenn Sie für diesen Ereignistyp eine logbasierte Benachrichtigungsrichtlinie erstellen möchten, verwenden Sie die folgende Abfrage:
resource.type=gce_instance_group_manager log_id(cloudaudit.googleapis.com%2Factivity) operation.first=true protoPayload.methodName=(beta.compute.instanceGroupManagers.patch OR v1.compute.instanceGroupManagers.patch)
Weitere Informationen finden Sie unter Mit verwalteten Instanzen arbeiten und Fehlerbehebung bei verwalteten Instanzgruppen.
Autoscaling für verwaltete Instanzgruppen
Dieses Ereignis verfolgt Skalierungsentscheidungen, die vom Autoscaling einer verwalteten Instanzgruppe getroffen wurden. Diese Entscheidungen können Änderungen an der empfohlenen Größe für eine verwaltete Instanzgruppe oder eine Statusänderung des Autoscalings selbst umfassen. Weitere Informationen finden Sie unter Autoscaling von Instanzgruppen.
Wenn Sie für diesen Ereignistyp eine logbasierte Benachrichtigungsrichtlinie erstellen möchten, verwenden Sie die folgende Abfrage:
resource.type=autoscaler log_id(cloudaudit.googleapis.com%2Fsystem_event) protoPayload.methodName=(compute.autoscalers.resize OR compute.autoscalers.changeStatus)
Ereignistypen für Personalized Service Health
In diesem Abschnitt werden die Personalized Service Health-Typen beschrieben, die in einem Dashboard angezeigt werden können.
Google Cloud-Vorfall
Bei der Fehlerbehebung sollten Sie zwischen Fehlern unterscheiden, die von einem eigenen Dienst und einem von einem von Ihnen verwendeten Google Cloud-Dienst verursacht werden. Wenn Sie Personalized Service Health-Annotationen in einem Dashboard aktivieren, können Sie Unterbrechungen oder Dienststatusereignisse für Google Cloud-Dienste aufrufen. Eine Liste der in Service Health eingebundenen Dienste finden Sie unter Unterstützte Google-Produkte.
Im Gegensatz zu anderen Ereignistypen werden Google Cloud-Vorfälle nicht durch die Analyse Ihrer Logeinträge identifiziert. Wenn Sie bei diesen Ereignissen benachrichtigt werden möchten, müssen Sie eine Benachrichtigungsrichtlinie erstellen. Sie können eine vorkonfigurierte Benachrichtigungsrichtlinie mithilfe der Optionen auf der Seite Service Health-Dashboard auswählen. Weitere Informationen finden Sie unter Kurzanleitung: Benachrichtigung einrichten.
Monitoring identifiziert Google Cloud-Vorfälle, indem es eine Anfrage an die Service Health API sendet und dann die Antwort auf Vorfälle filtert, die für die angezeigten Daten relevant sind. Die Anfrage hat die folgende Konfiguration:
Die Aufzählung
Relevance
ist aufRELATED
,IMPACTED
oderPARTIALLY_RELATED
festgelegt. Durch diese Einschränkung wird sichergestellt, dass im Dashboard nur Ereignisse für die Google Cloud-Dienste angezeigt werden, die von Ihrem Google Cloud-Projekt verwendet werden.Die Aufzählung
DetailedState
ist nicht aufFALSE_POSITIVE
festgelegt.
Service Health-Annotationen werden mit einer Startzeit und einer Dauer angezeigt. Die Dauer wird durch Ändern der Hintergrundfarbe des Diagramms angezeigt. Die Kurzinfo für einen Google Cloud-Vorfall enthält Folgendes:
- Der Google Cloud-Dienst.
- Ob der Vorfall offen oder behoben ist
- Datum und Startzeit des Ereignisses.
- Chips, die die Anzahl der betroffenen Produkte und Standorte anzeigen. Wenn Sie die betroffenen Produkte oder Standorte auflisten möchten, platzieren Sie den Mauszeiger auf dem entsprechenden Chip.
- Eine Schaltfläche View (Ansicht), die die Detailseite für den Vorfall öffnet.
Informationen zum Senden einer Anfrage an die Service Health API finden Sie unter Mit Service Health auf Unterbrechungen prüfen.
Informationen zur Fehlerbehebung finden Sie unter Häufige Probleme in Service Health beheben.
Ereignistypen für Verfügbarkeitsdiagnosen
In diesem Abschnitt werden die Ereignistypen für Verfügbarkeitsdiagnosen beschrieben, die in einem Dashboard angezeigt werden können.
Verfügbarkeitsdiagnose fehlgeschlagen
Mit diesem Ereignistyp können Sie Fehler bei Verfügbarkeitsdiagnosen in konfigurierten Regionen identifizieren.
Wenn Sie für diesen Ereignistyp eine logbasierte Benachrichtigungsrichtlinie erstellen möchten, verwenden Sie die folgende Abfrage:
log_id(monitoring.googleapis.com%2Fuptime_checks) ( resource.type=uptime_url OR resource.type=gce_instance OR resource.type=gae_app OR resource.type=k8s_service OR resource.type=servicedirectory_service OR resource.type=cloud_run_revision OR resource.type=aws_ec2_instance OR resource.type=aws_elb_load_balancer ) labels.uptime_result_type=UptimeCheckResult severity=NOTICE
Informationen zur Fehlerbehebung finden Sie unter Fehler beim synthetischen Monitoring und Verfügbarkeitsdiagnosen beheben.
Nächste Schritte
Informationen zum Anzeigen von Ereignissen auf Ihren Dashboards finden Sie unter Ereignisse in einem Dashboard anzeigen.