Cloud Monitoring

Dieses Dokument bietet einen Überblick über die Dienste, die Cloud Monitoring bietet. Mit diesen Diensten können Sie das Verhalten, den Zustand und die Leistung Ihrer Anwendungen und anderer Google Cloud-Dienste besser verstehen. Cloud Monitoring erfasst und speichert automatisch Leistungsinformationen für die meisten Google Cloud-Dienste. Ich kann Prometheus erfassen mit Google Cloud Managed Service for Prometheus. Wenn Sie den Ops-Agent auf Ihren Compute Engine-VMs installieren, können Sie Messwerte und Protokolle aus Ihren Anwendungen und von Drittanbieteranwendungen erfassen.

Mit den Benachrichtigungs-, Test- und Visualisierungsdiensten von Cloud Monitoring können Sie wichtige Fragen beantworten, z. B.:

  • Wie hoch ist die Last auf meinem Dienst?
  • Reagiert meine Website richtig?
  • Läuft mein Dienst gut?

Cloud Monitoring bietet für die meisten für seine Dienste. Einige Dienste unterstützen auch die Google Cloud CLI oder Terraform. Auf den Referenzseiten der Cloud Monitoring API, z. B. auf der Seite alertPolicies.list, können Sie direkt mit API-Aufrufen experimentieren.

Cloud Monitoring-Dienste

Cloud Monitoring bietet verschiedene Dienste, die Sie um den Zustand und die Leistung Ihrer Anwendungen und die andere von Ihnen verwendete Google Cloud-Dienste.

Warnungen und Benachrichtigungen

Wenn Sie benachrichtigt werden möchten, wenn der Wert eines Leistungsmesswerts die von Ihnen definierten Kriterien erfüllt, erstellen Sie eine Benachrichtigungsrichtlinie. Benachrichtigungsrichtlinie enthält die Liste der Personen oder Gruppen, die Benachrichtigungen erhalten sollen. Monitoring unterstützt gängige Benachrichtigungskanäle wie E-Mail, die Cloud Mobile App und Dienste wie PagerDuty oder Slack. Sie können beispielsweise eine Benachrichtigungsrichtlinie erstellen, damit Sie benachrichtigt werden, wenn die CPU-Auslastung einer VM 80 % überschreitet.

Jede Benachrichtigung enthält relevante Informationen zu einem Fehler und einen Link zu einem Vorfall. Ein Vorfall ist ein dauerhafter Datensatz, in dem Informationen, mit denen Sie den Fehler beheben können. In der Regel wird ein Datensatz Listet den Status des Vorfalls, Links zu Logs und ein Diagramm mit den aufgezeichneten Messwerten auf. Daten, Labels und Dauer.

Der Benachrichtigungsdienst ist in viele Google Cloud-Dienste eingebunden. Wenn diese Integrationen vorhanden sind, wird möglicherweise ein Steuerfeld mit empfohlenen Benachrichtigungen angezeigt oder in einem Diagramm eine Schaltfläche, mit der Sie eine Benachrichtigungsrichtlinie erstellen können. In beiden Fällen sind die Benachrichtigungsrichtlinien vorkonfiguriert. Sie müssen nur die Liste der Personen oder Gruppen angeben, die benachrichtigt werden sollen.

Sie können Benachrichtigungsrichtlinien mit der Google Cloud Console, der Cloud Monitoring API, der Google Cloud CLI oder Terraform erstellen und verwalten.

Proaktives Monitoring und Validierung

Um die Verfügbarkeit, Konsistenz und Leistung Ihrer Dienste zu testen, Anwendungen, Webseiten und APIs erstellen, synthetische Monitore. Beispiel: können Sie die Reaktionsfähigkeit von HTTP-, HTTPS- und TCP-Endpunkten mit Verfügbarkeitsdiagnosen eingerichtet haben. Sie werden dann benachrichtigt, der Endpunkt nicht reagiert. Sie können auch einen Link-Checker erstellen, um eine Webseite zu crawlen und Sie dann zu benachrichtigen, wenn fehlerhafte Links erkannt werden.

Sie können synthetisches Monitoring in der Google Cloud Console erstellen und verwalten, der Cloud Monitoring API, der Google Cloud CLI oder Terraform.

Datenvisualisierung

Mit den Dashboard- und Diagrammdiensten können Sie Ihre Daten visualisieren, um Trends zu erkennen, Ausreißer zu identifizieren und weitere Details zu Ihren Daten zu sehen:

Datenerhebung und -speicherung

Cloud Monitoring erfasst und speichert die folgenden Arten von Messwertdaten:

  • Logbasierte Messwerte, die numerische Informationen über die in Cloud Logging geschriebenen Logs Zu den von Google definierten logbasierten Messwerten gehören Anzahl der vom Dienst erkannten Fehler und der Gesamtzahl Anzahl der Logeinträge, die von Ihrem Google Cloud-Projekt empfangen wurden. Sie können auch logbasierte Messwerte definieren.

Abfragesprachen

Wenn Sie eine Benachrichtigungsrichtlinie oder ein Diagramm erstellen, müssen Sie eine Abfrage angeben, in der die Daten beschrieben werden, die Sie überwachen oder in einem Diagramm darstellen möchten:

  • Google Cloud Console: Sie können Ihre Abfrage durch Auswahl von Optionen in Menüs erstellen oder eine Abfrage schreiben. Abfrageeditoren sind für die Prometheus Query Language (PromQL) und Monitoring Query Language (MQL) Die Abfrageeditoren bieten Syntaxprüfungen und Vorschläge. Sie können auch Schreiben Sie einen Monitoring-Filterausdruck.

  • Cloud Monitoring API: Die API unterstützt Prometheus Query Language (PromQL), MQL-Abfragen und Monitoring-Filterausdrücke.

Große Systeme überwachen

In diesem Abschnitt wird beschrieben, wie Sie Ressourcen als Sammlung verwalten und Messwerte überwachen, die in mehreren Google Cloud-Projekten gespeichert sind.

Ressourcen als Sammlung verwalten

Ressourcen als Sammlung verwalten Erstellen Sie stattdessen eine Ressourcengruppe. Eine Ressourcengruppe ist eine dynamische Sammlung von Ressourcen. die bestimmte Kriterien erfüllen, die Sie angeben. Wenn Sie Ressourcen hinzufügen oder entfernen, z. B. indem Sie Ihrem Google Cloud-Projekt Compute Engine-VM-Instanzen hinzufügen, ändert sich die Mitgliedschaft in der Gruppe automatisch. Im Folgenden finden Sie Beispiele für Ressourcengruppen:

  • Compute Engine-Instanzen, deren Namen mit dem String prod- beginnen.
  • Ressourcen mit dem Tag test-cluster
  • Amazon EC2-Instanzen in Region A oder Region B.

Nachdem Sie eine Ressourcengruppe definiert haben, können Sie die Gruppe wie eine einzelne Ressource überwachen. Sie können beispielsweise eine Verfügbarkeitsdiagnose für die Überwachung einer Ressourcengruppe konfigurieren. Bei Diagrammen und Benachrichtigungsrichtlinien können Sie auch nach dem Gruppennamen filtern.

Weitere Informationen finden Sie unter Ressourcengruppen konfigurieren.

Messwerte für mehrere Google Cloud-Projekte überwachen

Wenn Sie die Zeitreihendaten für mehrere Google Cloud-Projekte und AWS-Konten über eine einzige Benutzeroberfläche aufrufen und überwachen möchten, konfigurieren Sie einen Messwertbereich mit mehreren Projekten.

Standardmäßig bieten Cloud Monitoring-Seiten in der Google Cloud Console Nur Zugriff auf die Zeitachsen, die im Projekt zur Festlegung des Umfangs gespeichert sind Die ist das Projekt, das Sie mit der Projektauswahl in der Google Cloud Console. Das den Umfang festlegende Projekt die Benachrichtigungen, synthetische Monitore, Dashboards und Gruppen überwachen die Sie konfigurieren.

Im Scoping-Projekt wird auch ein Messwertbereich gehostet. Der Messwertbereich definiert die Projekte und Konten, deren Messwerte für das Scoping-Projekt sichtbar sind. Sie können den Messwertbereich konfigurieren um Zeitreihendaten aus anderen Google Cloud-Projekten AWS-Konten Informationen zum Ändern eines Messwertbereichs finden Sie unter Messwertbereich für mehrere Projekte konfigurieren.

Cloud Monitoring-Datenmodell

In diesem Abschnitt wird das Cloud Monitoring-Datenmodell vorgestellt:

  • Ein Messwerttyp beschreibt etwas, gemessen. Beispiele für Messwerttypen sind die CPU-Auslastung einer VM und der Prozentsatz eines Speichers, der verwendet wird.

  • Eine Zeitachse ist eine Datenstruktur, die mit Zeitstempeln versehene Messungen eines Messwerts und Informationen über die Quelle und Bedeutung dieser Messungen enthält.

Im Folgenden finden Sie einige Details zum Inhalt einer Zeitreihe:

  • Das points-Array enthält die Messwerte mit Zeitstempel.

    Im folgenden Beispiel wird ein points-Array mit zwei Werten verwendet:

      "points": [
        {
          "interval": {
            "startTime": "2020-07-27T20:20:21.597143Z",
            "endTime": "2020-07-27T20:20:21.597143Z"
          },
          "value": {
            "doubleValue": 0.473005
          }
        },
        {
          "interval": {
            "startTime": "2020-07-27T20:19:21.597239Z",
            "endTime": "2020-07-27T20:19:21.597239Z"
          },
          "value": {
            "doubleValue": 0.473025
          }
        },
      ],
    

    Um die Bedeutung eines Werts zu verstehen, müssen Sie sich auf die anderen Daten in der Zeitreihe und auf die Definitionen dieser Daten beziehen.

  • Das Feld resource beschreibt die Hardware- oder Softwarekomponente. das überwacht wird. In Cloud Monitoring kann die Hardware oder Software Komponente wird als überwachte Ressource bezeichnet. Beispiele für überwachte Ressourcen sind Compute Engine und App Engine-Anwendungen. Eine Liste der überwachten Ressourcen finden Sie in der Liste der überwachten Ressourcen.

    Das folgende Beispiel zeigt ein resource-Feld:

      "resource": {
        "type": "gce_instance",
        "labels": {
          "instance_id": "2708613220420473591",
          "zone": "us-east1-b",
          "project_id": "sampleproject"
        }
      }
    
    • Im type-Feld wird die überwachte Ressource als gce_instance aufgelistet. Dies bedeutet, dass diese Messungen von einer Compute Engine-VM-Instanz stammen.

    • Das Feld labels enthält Schlüssel/Wert-Paare mit zusätzlichen Informationen zur überwachten Ressource. Bei einem gce_instance-Typ geben die Labels die VM-Instanz an, die überwacht wird.

  • Im metric-Feld wird beschrieben, was gemessen wird.

    Das folgende Beispiel zeigt ein metric-Feld:

      "metric": {
        "labels": {
          "instance_name": "test"
        },
        "type": "compute.googleapis.com/instance/cpu/utilization"
      },
    
    • Für Google Cloud-Dienste gibt das Feld type den Dienst und wird überwacht. In diesem Beispiel hat der Compute Engine-Dienst das Messen der CPU-Auslastung. Wenn das Feld type mit custom oder external beginnt, ist der Messwert entweder ein benutzerdefinierter Messwert oder ein von einem Drittanbieter definierter Messwert.
    • Das Feld labels enthält Schlüssel/Wert-Paare, die zusätzliche Informationen zur Messung. Diese Beschriftungen sind als Teil der die MetricDescriptor, eine Datenstruktur, die definiert die Attribute der gemessenen Daten. Die MetricDescriptor für den Messwert compute.googleapis.com/instance/cpu/utilization enthält das Label instance_name.
  • Das Feld metricKind beschreibt die Beziehung zwischen aufeinanderfolgenden Messungen innerhalb einer Zeitachse:

    • GAUGE-Messwerte speichern den Wert eines zu einer bestimmten Zeit gemessenen Elements, z. B. einen stündlichen Temperaturdatensatz.

    • In CUMULATIVE-Messwerten wird der kumulierte Wert des Objekts gespeichert, der zu einer bestimmten Zeit gemessen wurde, z. B. der Kilometerstand in einem Fahrzeug.

    • DELTA-Messwerte speichern Änderung an den Werten eines Elements, die zu einem bestimmten Zeitraum gemessen wurden, z. B. eine Aktienübersicht, die die Gewinne oder Verluste der Aktie anzeigt.

  • Das valueType-Feld beschreibt den Datentyp für die Messung: INT64, DOUBLE, BOOL, STRING oder DISTRIBUTION.

Beim Cloud Monitoring wird für jede Kombination aus Ressourcen- und Messwertlabelwerten eine Zeitachse geschrieben. Mit diesen Labels können Sie Zeitreihen gruppieren und filtern. Wenn ein Google Cloud-Projekt z. B. mehrere Compute Engine-VM-Instanzen: die CPU-Auslastung für jede VM-Instanz ist eine eindeutige Zeitachse. So können Sie diese Daten unter anderem darstellen:

  • Sie können die CPU-Auslastung jeder VM-Instanz anzeigen lassen.
  • Um die CPU-Auslastung für eine bestimmte VM-Instanz anzuzeigen, können Sie die Zeitachse nach einem einzelnen Wert des instance_id-Labels filtern.
  • Sie können nach den VM-Instanzen nach dem Label machine_type gruppieren. und zeigen die durchschnittliche CPU-Auslastung an. Folgender Screenshot zeigt ein Diagramm mit dieser Konfiguration:

    Durchschnittliche CPU-Auslastung, gruppiert nach Maschinentyp.

Preise

Im Allgemeinen sind Cloud Monitoring-Systemmesswerte kostenlos, Messwerte von externen Systemen, Agents oder Anwendungen hingegen nicht. Abrechenbare Messwerte werden entweder nach der Anzahl der aufgenommenen Byte oder der Anzahl der aufgenommenen Stichproben abgerechnet.

Weitere Informationen zu den Cloud Monitoring-Preisen finden Sie in den folgenden Dokumenten:

Nächste Schritte

  • Informationen zur Konfiguration unseres Google Cloud-Projekts für die Anzeige von Messwerten für mehrere Google Cloud-Projekte und AWS-Konten finden Sie unter Messwertbereiche – Übersicht.