Einführung in Cloud Monitoring

Cloud Monitoring ist eine umfangreiche Sammlung von Tools zur Beantwortung wichtiger Fragen:

  • "Ist mein Dienst fehlerfrei?"
  • "Wie hoch ist die Auslastung meines Dienstes?"
  • "Ist meine Website verfügbar und reagiert sie richtig?"
  • "Wie gut ist mein Dienst?"

Cloud Monitoring misst wichtige Aspekte Ihrer Dienste und gibt Ihnen die Möglichkeit, Messungen grafisch darzustellen. Sie werden benachrichtigt, wenn die Messungen keine zulässigen Werte haben. In diesem Dokument erhalten Sie eine kurze Überblick über diese Funktionen.

Monitoring-Techniken

Cloud Monitoring bietet vier Arten von Monitoring:

  1. Mit dem Blackbox-Monitoring können Sie Ihren Dienst auf dieselbe Weise überprüfen, wie ein Nutzer ihn verwenden würde: eine Webseite anfordern, eine Verbindung zu einem TCP-Port herstellen oder eine REST API aufrufen. Diese Art des Monitoring bietet keine Informationen zu den internen Funktionen Ihres Dienstes. Ihr Dienst wird als intransparente Entität behandelt. Cloud Monitoring bietet diese Art der Überwachung mit Verfügbarkeitsdiagnosen. Weitere Informationen finden Sie unter Dienst mit Verfügbarkeitsdiagnosen überwachen.

  2. Mit Whitebox-Monitoring können Sie wichtige Aspekte Ihres Dienstes überwachen. Sie können Ihren Dienst so programmieren, dass Zeitstempel mithilfe einer Bibliothek wie OpenCensus geschrieben werden, oder mithilfe der Cloud Monitoring API benutzerdefinierte Zeitachsendaten schreiben. Weitere Informationen finden Sie unter Benutzerdefinierte Messwerte verwenden.

  3. Grey-Box-Monitoring sammelt Informationen zum Status der Umgebung, in der Ihre Dienste ausgeführt werden. Diese Art von Monitoring wird durch eine Kombination aus Google Cloud-Produkten und Drittanbietern von Cloud Monitoring, z. B. Blue Medora, bereitgestellt. Beispiel:

    • Google Cloud-Dienste generieren Messwerte, die Informationen zur Funktionsweise des Dienstes liefern. Zum Beispiel meldet Compute Engine die CPU-Nutzung und die CPU-Auslastung jeder VM-Instanz sowie die Anzahl der von der Firewall verworfenen Byte und Pakete. Eine vollständige Liste finden Sie unter Google Cloud-Messwerte.
    • Der Cloud Monitoring-Agent erfasst System- und Anwendungsmesswerte. Wenn dieser Agent auf Compute Engine-VM-Instanzen installiert wird, erfasst er Laufwerk-, CPU-, Netzwerk- und Prozessmesswerte. Nach der Installation unter Linux kann der Agent auch so konfiguriert werden, dass Messwerte von Drittanbieter-Plug-ins erfasst werden.
    • Drittanbieter-Plug-ins bieten Daten auf Dienstebene auf Ihren Linux-VMs. Diese Informationen können Messwerte zu Ihren Apache- oder Nginx-Webservern sowie Messwerte zu Ihren MongoDB- oder PostgresSQL-Datenbanken enthalten.
  4. Logbasierte Messwerte sind Messwerte, die aus dem Inhalt von Logs erfasst werden, die in Cloud Logging geschrieben wurden. Zu den vordefinierten logbasierten Messwerten gehören beispielsweise Fehler, die Ihr Dienst erkennt, oder die Gesamtzahl empfangener Logeinträge. Sie können auch benutzerdefinierte logbasierte Messwerte definieren. Sie können beispielsweise die Anzahl der Logeinträge ermitteln, die mit einer bestimmten Abfrage übereinstimmen, oder bestimmte Werte in übereinstimmenden Logeinträgen verfolgen.

Überwachte Ressourcen, Messwertdeskriptoren und Zeitachsen

In diesem Abschnitt wird die von Cloud Monitoring verwendete Terminologie vorgestellt. Eine ausführlichere Erläuterung der in diesem Abschnitt vorgestellten Konzepte finden Sie unter Struktur von Zeitachsen.

Überwachte Ressourcen

Eine überwachte Ressource ist die überwachte Hardware- oder Softwarekomponente. Beispiele für überwachte Ressourcen sind Compute Engine-Laufwerke und -Instanzen sowie App Engine-Anwendungen und -Instanzen. Es gibt etwa 100 Arten von überwachten Ressourcen. Die aktuelle Liste finden Sie unter Liste der überwachten Ressourcen.

Jede Art von überwachter Ressource wird formell in einer Datenstruktur namens MonitoredResourceDescriptor beschrieben. Hier ist beispielsweise der Deskriptor der überwachten Ressource für die Ressource gce_instance:

{
  "type": "gce_instance",
  "displayName": "G​C​E VM Instance",
  "description": "A virtual machine instance hosted in Compute Engine (G​C​E).",
  "name": "projects/PROJECT_ID/monitoredResourceDescriptors/gce_instance"
  "labels": [
    {
      "key": "project_id",
      "description": "The identifier of the Google Cloud project associated with this resource, such as \"my-project\"."
    },
    {
      "key": "instance_id",
      "description": "The numeric VM instance identifier assigned by Compute Engine."
    },
    {
      "key": "zone",
      "description": "The Compute Engine zone in which the VM is running."
    }
  ],
}

Wenn ein Dienst Daten in Cloud Monitoring schreibt, beziehen sich diese Daten immer auf eine überwachte Ressource. Wenn Sie diese Daten aufrufen, können Sie diese Labels verwenden, die als Schlüssel/Wert-Paare dargestellt werden, um festzustellen, welche Daten generiert wurden. Wenn sich beispielsweise Daten auf die überwachte Ressource gce_instance beziehen, können Sie die jeweilige VM-Instanz anhand des Werts des Labels instance_id ermitteln.

Wenn Sie in Cloud Monitoring Diagramme oder Benachrichtigungsrichtlinien erstellen, können Sie Ihre Daten basierend auf den Werten der Labels in einer Zeitachse filtern und gruppieren. Wenn Sie beispielsweise ein Google Cloud-Projekt mit mehreren Compute Engine-VM-Instanzen haben, können Sie ein Diagramm erstellen, das die Zeitachse der CPU-Auslastung jeder Instanz anzeigt. Wenn Sie einen Filter für instance_id hinzufügen, können Sie nur die CPU-Auslastung einer bestimmten VM-Instanz anzeigen.

Messwertdeskriptoren

Alle an Cloud Monitoring gesendeten Daten werden durch einen Messwertdeskriptor beschrieben. Ein Messwertdeskriptor ist eine Definition, die die Attribute der Daten beschreibt. Cloud Monitoring verfügt über ca. 1.500 integrierte Messwertdeskriptoren. Weitere Informationen finden Sie in der Messwertliste.

Hier ein Beispiel für einen Messwertdeskriptor:

    Metric type: agent.googleapis.com/disk/percent_used
    Display name: Disk utilization
    Metric kind: GAUGE
    Value type: DOUBLE
    Units: % (this symbol indicates a percentage which is a value between 0.0 and 100.0)
    Labels: device, state
    Monitored resource: gce_instance (this value refers to a Compute Engine VM instance)

Der Rest dieses Abschnitts beschreibt einige der wichtigsten Attribute eines Messwertdeskriptors. Eine vollständige Beschreibung finden Sie unter MetricDescriptor:

  • Messwerttyp

    Der Messwerttyp ähnelt einer URL. Bei Google Cloud-Diensten und bei bestimmten Integrationen von Drittanbietern gibt der erste Teil des Messwerttyps die Quelle der Zeitachsen an und der Rest beschreibt, was beobachtet wird. Im Beispiel für einen Messwertdeskriptor gibt agent.googleapis.com die Quelle als Cloud Monitoring-Agent an und disk/percent_used gibt an, dass der verwendete Prozentsatz gemessen wird. Bei benutzerdefinierten Messwerten wird dem Messwerttyp das Präfix external.googleapis.com oder custom.googleapis.com vorangestellt.

    Messwerttypen sind global eindeutig.

    Da der Messwerttyp global eindeutig ist, werden die Begriffe metric descriptor und metric type oft ausgetauscht. In der Google Cloud Console wird der Begriff Messwert oft anstelle von Messwerttyp verwendet.

  • Anzeigename

    Der Anzeigename ist ein kurzer, beschreibender Name für den Messwertdeskriptor. Im Beispiel lautet der Anzeigename "Disk utilization" (Laufwerkauslastung). Der Anzeigename, der möglicherweise nicht eindeutig ist, wird in der Google Cloud Console zur Vereinfachung der Datenanzeige verwendet.

  • Messwertart

    Die Messwertart beschreibt die Beziehung zwischen nebeneinander gemessenen Werten innerhalb einer Zeitachse:

    • GAUGE-Messwerte speichern den Wert des zu einem bestimmten Zeitpunkt gemessenen Elements. Eine Analogie ist der Geschwindigkeitsmesser in einem Fahrzeug, der die aktuelle Geschwindigkeit erfasst.

    • CUMULATIVE-Messwerte speichern den kumulierten Wert der gemessenen Zeit zu einem bestimmten Zeitpunkt. Eine Analogie ist der Kilometerstand in Ihrem Auto, der die zurückgelegte Gesamtstrecke aufzeichnet.

    • DELTA-Messwerte speichern die Änderung des Werts der Dinge, die in einem bestimmten Zeitraum gemessen werden. Eine Analogie ist das Tagesstand, das täglich zurückgesetzt wird. Dabei handelt es sich um die Gesamtstrecke, die Sie an diesem Tag oder seit der letzten Rückreise zurückgelegt haben. Ein weiteres Beispiel ist eine Aktienkursübersicht, die Ihnen zeigt, wie viel Geld Sie heute auf dem Markt verdient oder verloren haben.

    Weitere Informationen finden Sie unter MetricKind.

  • Werttyp

    Der Werttyp beschreibt den Datentyp für die Messung. Numerische Messwerte sind INT64 oder DOUBLE. Messwerte können auch Werte vom Typ BOOL, STRING oder DISTRIBUTION haben. Alle Datenpunkte innerhalb einer Zeitachse haben denselben Werttyp.

    Weitere Informationen zu Werttypen finden Sie unter ValueType.

  • Messwerteinheit

    Die Messwerteinheit beschreibt die Einheit oder Messung, in der ein Datenpunkt erfasst wird.

    Beispiel: By ist die Standardschreibweise, die angibt, dass Byte und kBy Kilobyte oder tausende Byte sind. Zum Aufzeichnen von 1126 Byte, die geschrieben wurden, wenn die Einheit kBy ist, lautet der Wert 1.126. Zu den verfügbaren Messwerteinheiten gehören auch diejenigen, die sich für digitale Informationen eignen: Beispiel: KiBy ist "1.024 Bytes" (Bytes). Der Wert ist 1.099, wenn aufgezeichnet wird, dass 1126 Byte geschrieben wurden, wenn die Einheit KiBy ist.

    Weitere Informationen zu Messwerteinheiten finden Sie unter Einheiten.

  • Labels

    Einige Messwertdeskriptoren geben Labels an, um die in der überwachten Ressource definierten Labels zu erweitern. Sie können die Daten beim Erstellen von Diagrammen oder Benachrichtigungsrichtlinien nach dem Labelwert filtern und gruppieren.

    Der Beispiel für einen Messwertdeskriptor enthält die Labels für device und state. Das Label device verweist auf die Laufwerkkennung und das Label state gibt an, ob die Zeitachse Werte für kostenlosen Speicherplatz, belegten Speicherplatz oder reservierten Speicherplatz enthält. Wenn Sie Daten aufrufen, die die Laufwerksnutzung einer Compute Engine-VM-Instanz zeigen, sehen Sie Daten für den Messwerttyp agent.googleapis.com/disk/percent_used, der in einer Compute Engine-VM-Instanz geschrieben wurde. Die Daten enthalten fünf Labels: die drei im Deskriptor der überwachten Ressource und die beiden im Messwertdeskriptor definiert. Mithilfe von Filtern können Sie beispielsweise nur den freien Speicherplatz oder nur den freien Speicherplatz für eine bestimmte VM anzeigen.

Zeitachse

Eine Zeitachse ist eine Sammlung von Messungen und Metadaten zu diesen Messungen. Im Folgenden wird ein Ausschnitt einer Zeitachse dargestellt:

{
  "timeSeries": [
    {
      "metric": {
        "labels": {
          "device": "sda1",
          "state": "free"
        },
        "type": "agent.googleapis.com/disk/percent_used"
      },
      "resource": {
        "type": "gce_instance",
        "labels": {
          "instance_id": "2708613220420473591",
          "zone": "us-east1-b",
          "project_id": "sampleproject"
        }
      },
      "metricKind": "GAUGE",
      "valueType": "DOUBLE",
      "points": [
        {
          "interval": {
            "startTime": "2020-07-27T20:20:21.597143Z",
            "endTime": "2020-07-27T20:20:21.597143Z"
          },
          "value": {
            "doubleValue": 0.473005
          }
        },
        {
          "interval": {
            "startTime": "2020-07-27T20:19:21.597239Z",
            "endTime": "2020-07-27T20:19:21.597239Z"
          },
          "value": {
            "doubleValue": 0.473025
          }
        },
      ],
    },

Jede Zeitachse hat eine eindeutige Sammlung von Labelwerten. Wie in diesem Beispiel dargestellt, enthält die Zeitachse Messwertlabels und Ressourcenlabels. Die Werte der Labels zeigen, dass die Zeitachsen für den kostenlosen Speicherplatz des Laufwerks "sda1" bestimmt sind, der Teil der VM-Instanz mit der ID 2708613220420473591 ist. Es gibt eine andere Zeitachse für den kostenlosen Speicherplatz des Laufwerks und eine weitere für den reservierten Speicherplatz des Laufwerks. Das Beispiel enthält zwei Messungen, wobei jede Messung ein Punkt ist, der durch ein Zeitintervall und einen Wert dargestellt wird.

Zeitachsendaten ansehen

Zum Ansehen von Zeitachsendaten können Sie den Metrics Explorer verwenden oder ein Diagramm in einem Dashboard aufrufen.

Metrics Explorer

Der Metrics Explorer bietet eine menügesteuerte Oberfläche, in der Sie den Typ der überwachten Ressource und den Messwerttyp auswählen, dessen Zeitachsendaten Sie aufrufen möchten. Nachdem Sie diese Auswahl getroffen haben, können Sie Filter anwenden, sodass nur bestimmte Zeitachsen angezeigt werden. Wenn Sie komplexe Konfigurationen verwalten möchten, bietet der Metrics Explorer eine Reihe von Aggregationsoptionen. Weitere Informationen zu diesen Optionen finden Sie unter Filtern und Aggregation.

Der folgende Screenshot zeigt beispielsweise die durchschnittliche, freie und reservierte Laufwerksauslastung für die Laufwerke aller VM-Instanzen, die sich in der Zone "us-central1-a" befinden:

Im Metrics Explorer angezeigte Laufwerksauslastung.

Wenn Sie Trends untersuchen möchten, können Sie den Metrics Explorer so konfigurieren, dass aktuelle Zeitachsendaten mit vorherigen Daten verglichen werden.

Wenn Sie eine Vergleichsanalyse verschiedener Daten durchführen möchten, können Sie Diagramme erstellen, die Zeitachsendaten für mehrere Messwertdeskriptoren darstellen. So können Sie in einem Diagramm beispielsweise Daten zum Traffic, zur Latenz und zu Verkäufen anzeigen.

Weitere Informationen finden Sie unter Metrics Explorer.

Diagramme und Dashboards

Sie können Dashboards verwenden, um Informationen zu einer Ressourcensammlung anzuzeigen. Cloud Monitoring unterstützt zwei verschiedene Arten von Dashboards:

  • Vorkonfigurierte Dashboards werden von Cloud Monitoring automatisch erstellt, wenn eine Ressource in Ihrem Dienst verwendet wird. Wenn Ihr Dienst beispielsweise mit einem Apache-Webserver in Google Cloud erstellt wird, werden automatisch Dashboards für den Webserver, für jedes Compute Engine-Laufwerk, für die Firewalls und für Compute Engine-VM-Instanzen. Wenn die Laufwerke durch Snapshots gesichert werden, werden automatisch zusätzliche Dashboards erstellt.

    Vorkonfigurierte Dashboards sind so konzipiert, dass sie die am häufigsten aufgerufenen Informationen darstellen. Das Dashboard für eine Compute Engine-VM-Instanz enthält beispielsweise Informationen zur Zone, zu öffentlichen und privaten IP-Adressen sowie Diagramme zur CPU-Nutzung und weitere interessante Daten.

  • Mit benutzerdefinierten Dashboards können Sie eine Sammlung von Diagrammen erstellen, die Sie darstellen möchten. Wenn Sie einem Dashboard ein Diagramm hinzufügen möchten, können Sie die Funktion zum Hinzufügen von Diagrammen in einem Dashboard verwenden oder ein Diagramm mit Metrics Explorer erstellen und im Dashboard speichern. Wenn Sie die Google Cloud Console zum Erstellen eines Dashboards verwenden, werden die Diagramme in einem Rastermuster angezeigt. Sie können auch komplexere Konfigurationen mithilfe der Dashboards API erstellen.

Weitere Informationen zu Diagrammen und Dashboards finden Sie unter Dashboards und Diagramme verwenden.

Zeitachsendaten überwachen

Wenn Sie benachrichtigt werden möchten, wenn Zeitachsen bestimmte Bedingungen erfüllen, erstellen Sie eine Benachrichtigungsrichtlinie. Sie können sowohl einfache als auch komplexe Benachrichtigungsrichtlinien erstellen. Zum Beispiel:

  • "Benachrichtigen, wenn die Verfügbarkeitsdiagnose länger als drei Minuten an einem Standort fehlgeschlagen ist."

  • "Das zuständige Team benachrichtigen, wenn das 90. Perzentil der HTTP-200-Antworten von drei oder mehr Webservern an zwei verschiedenen Google Cloud-Standorten die Antwortlatenz von 100 ms überschreitet, sofern weniger als 15 Abfragen pro Sekunde auf dem Server erfolgen."

Cloud Monitoring bietet ein Benachrichtigungs-Dashboard, über das Sie Ihre Richtlinien verwalten und aufrufen können.

Dieser Abschnitt bietet einen kurzen Überblick über Benachrichtigungen. Weitere Informationen finden Sie unter Einführung in Benachrichtigungen.

Komponenten von Benachrichtigungsrichtlinien

In Cloud Monitoring besteht eine Benachrichtigungsrichtlinie aus vier Komponenten:

  • Einem Namen, der im Benachrichtigungs-Dashboard angezeigt wird und in versendete Benachrichtigungen eingefügt wird.
  • Eine Liste der Benachrichtigungskanäle, die angeben, wer benachrichtigt wird Monitoring unterstützt gängige Benachrichtigungskanäle. Sie können eine Benachrichtigung konfigurieren, die per E-Mail, an ein Mobilgerät oder an einen Dienst wie PagerDuty oder Slack gesendet werden soll. Eine vollständige Liste finden Sie unter Benachrichtigungsoptionen.

  • Eine benutzerdefinierte Dokumentation, die in die Benachrichtigung aufgenommen werden soll. Sie können diese Inhalte beispielsweise konfigurieren, um zu beschreiben, welche Maßnahmen ein menschlicher Operator ausführen sollte. Dieses Feld unterstützt die Verwendung von parametrisierten Variablen. Weitere Informationen finden Sie unter Variablen in Dokumentationsvorlagen.

  • Eine oder mehrere Bedingungen, die von der Benachrichtigungsrichtlinie ausgewertet werden Jede Bedingung gibt eine überwachte Ressource, einen Messwerttyp und den Zeitpunkt an, an dem diese Bedingung erfüllt wird. Zum Beispiel kann eine Bedingung die Laufwerkauslastung einer VM-Instanz überwachen und erfüllt werden, wenn der freie Speicherplatz für mindestens fünf Minuten weniger als 10 % beträgt.

Wenn die Bedingungen einer Benachrichtigungsrichtlinie erfüllt sind, wird ein Vorfall generiert und Benachrichtigungen werden ausgegeben. Wenn die Bedingungen nicht mehr erfüllt sind, wird der Vorfall automatisch gelöst und es wird eine weitere Benachrichtigung an die angegebenen Benachrichtigungskanäle gesendet.

Beispiel: Benachrichtigungsrichtlinie für freien Speicherplatz

Angenommen, Sie möchten benachrichtigt werden, wenn der freie Speicherplatz für alle Laufwerke mit dem Namen tmpfs auf den VM-Instanzen in der Zone "us-central1-a" unter 35 % liegt.

Sie möchten eine Benachrichtigungsrichtlinie erstellen. Gehen Sie dazu folgendermaßen vor:

  1. Wechseln Sie in der Google Cloud Console zu Cloud Monitoring und klicken Sie dann auf Benachrichtigungen.

  2. Klicken Sie auf Richtlinie erstellen, um eine neue Benachrichtigungsrichtlinie zu erstellen. Geben Sie im daraufhin angezeigten Dialogfeld einen Namen ein und wählen Sie Bedingung hinzufügen aus.

  3. Im Bedingungsdialogfeld müssen Sie die überwachte Ressource und den Messwerttyp auswählen und Filter anwenden:

    Ressourcentyp auswählen.

    Für diese Benachrichtigung haben Sie folgende Möglichkeiten:

    1. Wählen Sie VM instance als Ressourcentyp aus.
    2. Wählen Sie Disk Utilization als Messwert aus.
    3. Sie fügen Filter für Zone, Status und Laufwerk hinzu:

      • zone = "us-central1-a".
      • state = "free"
      • disk = "tmpfs"

    Mit diesen Optionen zeigt das interaktive Diagramm den freien Speicherplatz für jedes "tmpfs"-Laufwerk in der Zone "us-central1-a" an:

    Benachrichtigungsrichtlinie, die die Laufwerksauslastung anzeigt.

    Der Screenshot zeigt, dass in einem Projekt zwei "tmpfs"-Laufwerke in der Zone "us-central1-a" enthalten sind.

  4. Die Bedingung muss erfüllt sein, wenn "der freie Speicherplatz für jedes Laufwerk unter 35 % liegt". Sie geben diese Informationen im Bereich Konfiguration ein:

    Bedingung, die die Konfiguration anzeigt.

    • Wählen Sie für Bedingung erfüllt, wenn die Option Verstoß beliebiger Zeitachse aus.

      Sie haben diesen Wert ausgewählt, weil Sie in einer der Zeitachsen über einen Wert von 35 % informiert werden möchten. Es gibt noch weitere Optionen. Beispielsweise könnten Sie dieses Feld so einstellen, dass es alle Zeitachsen, eine bestimmte Anzahl von Zeitachsen oder einen Prozentsatz von Zeitachsen umfasst.

    • Setzen Sie die Bedingung auf liegt unter und den Schwellenwert auf 35 %.

      Sie haben diese Einstellungen ausgewählt, weil Sie den Wert der Zeitachse mit 35 % vergleichen und benachrichtigt werden möchten, wenn der Wert unter dieser Zahl liegt. Weitere Optionen sind "liegt über", "ist nicht vorhanden" oder wie schnell sich der Wert ändert.

    • Wählen Sie unter Für die Option aktueller Wert aus.

      Sie haben aktueller Wert ausgewählt, da Sie sofort benachrichtigt werden möchten, wenn der freie Speicherplatz unter 35 % liegt. Im Feld Für wird eine Dauer angegeben. Wenn dieses Feld auf fünf Minuten festgelegt ist, muss der freie Speicherplatz 5 Minuten lang weniger als 35 % betragen, damit die Benachrichtigung gesendet wird. In diesem Fall wurde der Standardwert für das Feld "Dauer" auf eine Minute gesetzt. Dies ist lange genug, um sicherzustellen, dass ein einzelner Messwert nicht zu einem Vorfall führt.

  5. Sie vervollständigen die Richtlinie ab, indem Sie die Bedingung speichern, Ihre Benachrichtigungskanäle hinzufügen und die Dokumentation hinzufügen.

In diesem Beispiel wird bei Erstellung der Bedingung ein Vorfall erstellt und eine Benachrichtigung gesendet.

Dienst mit Verfügbarkeitsdiagnosen überwachen

Cloud Monitoring bietet Blackbox-Monitoring mit Verfügbarkeitsdiagnosen. Wenn Sie eine Verfügbarkeitsdiagnose für einen Dienst konfigurieren, wird der Dienst regelmäßig auf die Reaktionsfähigkeit von Servern an mindestens drei verschiedenen Standorten überprüft.

Die Verfügbarkeitsdiagnose zeichnet den Erfolg oder Misserfolg der Antwort sowie die Latenz der Antwort als Zeitachse auf. Cloud Monitoring erstellt ein Dashboard für jede Verfügbarkeitsdiagnose in Ihrem Google Cloud-Projekt. In einem Verfügbarkeitsdiagnose-Dashboard können Sie die Latenz der Antworten, den Antwortverlauf und detaillierte Informationen zur Diagnose anzeigen. Sie können diese Daten auch aufrufen, indem Sie ein Diagramm mit dem Metrics Explorer erstellen oder ein Diagramm zu einem benutzerdefinierten Dashboard hinzufügen. Informationen zu Diagrammeinstellungen finden Sie unter Diagramm zur Verfügbarkeitslatenz erstellen.

Sie können die Verfügbarkeitsdiagnose auch so konfigurieren, dass sie mit einer Benachrichtigungsrichtlinie verknüpft ist. Mit dieser Konfiguration werden Sie von der Benachrichtigungsrichtlinie benachrichtigt, wenn die Verfügbarkeitsdiagnose fehlschlägt. Weitere Informationen finden Sie unter Verfügbarkeitsdiagnosen.

Cloud Monitoring bietet ein Verfügbarkeits-Dashboard, das eine Zusammenfassung Ihrer Verfügbarkeitsdiagnosen anzeigt. Sie können die Anzeige wie im folgenden Screenshot filtern und mit den eingebetteten Links die Details einer bestimmten Verfügbarkeitsdiagnose anzeigen lassen:

Übersicht über Beispiele für Verfügbarkeitsdiagnosen mit Filtern

Monitoring-Gruppen

Eine Cloud Monitoring-Gruppe ist eine Sammlung von Google Cloud- oder AWS-Ressourcen mit bestimmten Attributen, die Sie angeben. Beispiele für Gruppen: "Jede Compute Engine-Instanz, deren Name mit einem bestimmten String beginnt", "alle Ressourcen mit bestimmten Tags" und "Jede AWS-Computing-Ressource in Region A oder Region B". Wenn Sie Ressourcen hinzufügen oder entfernen, ändert sich die Mitgliedschaft in der Gruppe automatisch.

Wenn Sie eine Verfügbarkeitsdiagnose für eine Gruppe konfigurieren, prüft die Verfügbarkeitsdiagnose jedes Mitglied in der Gruppe, wenn die Prüfung ausgegeben wird.

Wenn Ressourcen hinzugefügt oder entfernt werden, passt die Verfügbarkeitsdiagnose automatisch deren Tests an. Im Dashboard für diese Verfügbarkeitsdiagnose können Sie die Latenz und die automatisch bestandene Zeitachse für jedes Mitglied der Gruppe ansehen. Sie können diese Arten von Verfügbarkeitsdiagnosen auch so konfigurieren, dass sie mit einer Benachrichtigungsrichtlinie verknüpft sind.

Wenn Sie ein Diagramm oder eine Benachrichtigungsrichtlinie erstellen, können Sie die Zeitachsen nach Cloud Monitoring-Gruppenname filtern und Zeitachsen nach Gruppenname gruppieren.

Weitere Informationen finden Sie unter Ressourcengruppen verwenden.

Monitoring von Arbeitsbereichen

Cloud Monitoring verwendet Arbeitsbereiche als Mechanismus, mit dem Sie Zeitachsendaten, die in mehreren Google Cloud-Projekten gespeichert sind, an einem Ort anzeigen und verwalten können. Der Arbeitsbereich speichert die Diagramme, Dashboards, Verfügbarkeitsdiagnosen und andere von Ihnen durchgeführte Konfigurationsaktionen.

Arbeitsbereiche sind für die meisten Nutzer transparent. Im einfachsten und häufigsten Szenario wird beim ersten Zugriff auf Monitoring in der Google Cloud Console automatisch ein Arbeitsbereich für Ihr Projekt erstellt. In diesem einfachen Fall überwacht der Arbeitsbereich ein einzelnes Google Cloud-Projekt.

Nachdem Sie einen Arbeitsbereich erstellt haben, können Sie auf der Seite Einstellungen des Arbeitsbereichs weitere Google Cloud-Projekte hinzufügen. Wenn Sie ein Projekt hinzufügen, aktivieren Sie Cloud Monitoring so, dass die in diesem Projekt gespeicherten Zeitachsendaten gelesen werden.

Eine Konzeptübersicht finden Sie unter Arbeitsbereiche.

Wenn Sie Ihre Dienste so überwachen möchten, wie Google seine Dienste verwaltet, lesen Sie die Informationen unter Konzepte der Dienstüberwachung. Mit der Dienstüberwachung definieren Sie die Leistungsziele Ihres Dienstes, wie Sie die Leistung messen und ein Fehlerbudget. Sie können Benachrichtigungsrichtlinien erstellen, um benachrichtigt zu werden, wenn Ihr Fehlerbudget schneller als gewünscht verbraucht wird.

Wenn Sie Google Kubernetes Engine verwenden, finden Sie unter Übersicht über die Operations-Suite von GKE weitere Informationen dazu, wie Sie Ihre GKE-Nutzung mit Cloud Monitoring und Cloud Logging beobachten können.

Erste Schritte mit Monitoring

Diese Seite bietet eine kurze Übersicht über die wichtigsten Komponenten von Cloud Monitoring.

Die Funktionen von Cloud Monitoring können Sie sich mit dem Cloud Monitoring-Schnellstart für Compute Engine ansehen. Die Kurzanleitung führt Sie durch das Erstellen einer Verfügbarkeitsdiagnose, einer Benachrichtigungsrichtlinie und zum Erstellen eines benutzerdefinierten Dashboards mithilfe der Cloud Monitoring Console. Die Cloud Monitoring-Konsole bietet eine menügesteuerte Benutzeroberfläche und unterstützt in einigen Fällen die Monitoring-Abfragesprache. MQL ist eine ausdrucksstarke, textbasierte Oberfläche zum Abfragen von Zeitachsendaten.

Sie können mit der programmatischen Oberfläche von Cloud Monitoring, der Cloud Monitoring API, auch Diagramme und Dashboards, Verfügbarkeitsdiagnosen, Benachrichtigungsrichtlinien und Gruppen erstellen und verwalten. Die API unterstützt die traditionelle filterbasierte Sprache und MQL. Weitere Informationen finden Sie unter Diagramm mit Monitoring-Abfragesprache erstellen und Dashboard über die API erstellen.

Weitere Informationen zu Monitoring finden Sie in den folgenden Ressourcen:

Informationen zu Preisen, Kontingenten und Limits finden Sie unter Ressourcen.

Eine Liste der überwachten Ressourcen finden Sie unter Liste überwachter Ressourcen.

Eine Liste der unterstützten Messwerte finden Sie in der Messwertliste.

Informationen zur Cloud Monitoring API finden Sie hier: