Logging und Monitoring

GKE on VMware bietet mehrere Optionen für Cluster-Logging und -Monitoring, einschließlich cloudbasierter verwalteter Dienste, Open-Source-Tools und validierter Kompatibilität mit kommerziellen Lösungen von Drittanbietern. In diesem Dokument werden diese Optionen beschrieben. Außerdem erhalten Sie grundlegende Informationen zur Auswahl der richtigen Lösung für Ihre Umgebung.

Optionen für GKE on VMware

Sie haben mehrere Logging- und Monitoring-Optionen für GKE on VMware:

Cloud Logging und Cloud Monitoring

Google Cloud Observability (früher Stackdriver) ist die integrierte Beobachtbarkeitslösung für Google Cloud. Sie bietet eine vollständig verwaltete Logging-Lösung, Messwerterfassung, Monitoring, Dashboards und Benachrichtigungen. Cloud Monitoring überwacht GKE on VMware-Cluster ähnlich wie cloudbasierte GKE-Cluster.

Sie können die clusterinternen Agents für den Umfang des Monitoring und Logging sowie die Ebene der erfassten Messwerte konfigurieren:

  • Der Umfang des Logging und Monitoring kann nur auf Systemkomponenten (Standardeinstellung) oder auf Systemkomponenten und Anwendungen festgelegt werden
  • Die Ebene der erfassten Messwerte kann für einen optimierten Satz von Messwerten oder für vollständige Messwerte konfiguriert werden

Weitere Informationen finden Sie in diesem Dokument unter Logging- und Monitoring-Agents für Anthos Clusters on VMware konfigurieren.

Cloud Logging und Cloud Monitoring sind die ideale Lösung für Kunden, die eine einzige, einfach zu konfigurierende und leistungsstarke cloudbasierte Beobachtbarkeitslösung benötigen. Wir empfehlen Logging und Monitoring dringend, wenn Sie Arbeitslasten nur in GKE on VMware oder Arbeitslasten in GKE und GKE on VMware ausführen. Für Anwendungen mit Komponenten, die auf GKE on VMware und in einer herkömmlichen lokalen Infrastruktur ausgeführt werden, können Sie andere Lösungen für eine End-to-End-Ansicht dieser Anwendungen in Betracht ziehen.

Drittanbieterlösungen

Google hat mit mehreren Logging- und Monitoring-Drittanbietern zusammengearbeitet, damit ihre Produkte gut mit GKE on VMware funktionieren. Dazu gehören Datadog, Elastic und Splunk. Weitere validierte Drittanbieter werden in Zukunft hinzugefügt.

Weitere Informationen zur Verwendung von Drittanbieterlösungen mit GKE on VMware finden Sie hier:

Funktionsweise von Logging und Monitoring für GKE on VMware

Logging- und Monitoring-Agents werden in jedem Cluster installiert und aktiviert, wenn Sie einen neuen Administrator- oder Nutzercluster erstellen. Die Agents erfassen Daten zu Systemkomponenten – der Umfang, den Sie konfigurieren können.

Damit Sie die erhobenen Daten in der Google Cloud Console ansehen können, müssen Sie das Google Cloud-Projekt konfigurieren, in dem die Logs und Messwerte gespeichert sind, die Sie aufrufen möchten.

Zu den Logging- und Monitoring-Agents in jedem Cluster gehören:

  • GKE-Messwert-Agent (gke-metrics-agent). Ein DaemonSet, das Messwerte an die Cloud Monitoring API sendet.

  • Stackdriver Log Forwarder (stackdriver-log-forwarder). Ein Fluent Bit-DaemonSet, das Logs von jeder Maschine an Cloud Logging weiterleitet. Der Log Forwarder puffert die Logeinträge auf dem Knoten lokal und sendet sie bis zu vier Stunden lang noch einmal. Wenn der Zwischenspeicher voll ist oder der Log-Forwarder die Cloud Logging API länger als vier Stunden nicht erreichen kann, werden Logs gelöscht.

  • Globaler GKE-Messwert-Agent (gke-metrics-agent-global). Ein Deployment, das Messwerte an die Cloud Monitoring API sendet.

  • Metadata-Agent (stackdriver-metadata-agent). Ein Modul, das Metadaten für Kubernetes-Ressourcen wie Pods, Deployments, Knoten usw. an die Stackdriver Resource Metadata API sendet. Anhand dieser Daten können Sie Messwertabfragen anreichern und Abfragen nach Deployment-Name, Knotenname oder auch Kubernetes-Dienstname ausführen.

  • kube-state-metrics: Ein Deployment, das den API-Server überwacht und Messwerte zu den Status von Objekten generiert.

  • node-exporter: Ein DaemonSet, das Hardware- und Betriebssystemmesswerte generiert.

Mit dem folgenden Befehl können Sie alle Deployment-Agents aufrufen:

  kubectl --kubeconfig CLUSTER_KUBECONFIG get deployments -l "managed-by=stackdriver" --all-namespaces

Dabei ist CLUSTER_KUBECONFIG der Pfad der kubeconfig-Datei für den Cluster.

Die Ausgabe dieses Befehls sieht so aus:

gke-metrics-agent-global                      1/1     Running   0   4h31m
stackdriver-metadata-agent-cluster-level      1/1     Running   0   4h31m

Mit dem folgenden Befehl können Sie alle DaemonSet-Agents aufrufen:

  kubectl --kubeconfig CLUSTER_KUBECONFIG get daemonsets -l "managed-by=stackdriver" --all-namespaces

Die Ausgabe dieses Befehls sieht so aus:

gke-metrics-agent                             1/1     Running   0   4h31m
stackdriver-log-forwarder                     1/1     Running   0   4h31m

Logging- und Monitoring-Agents für GKE on VMware konfigurieren

Die mit GKE on VMware installierten Agents erfassen Daten zu Systemkomponenten gemäß Ihren Einstellungen und Ihrer Konfiguration, um Probleme in Ihren Clustern zu verwalten und zu beheben.

Nur Systemkomponenten (Standardbereich)

Bei der Installation erfassen Agents Logs und Messwerte, einschließlich Leistungsdetails (z. B. CPU- und Speicherauslastung) und ähnliche Metadaten für von Google bereitgestellte Systemkomponenten. Dazu gehören alle Arbeitslasten im Administratorcluster und in Nutzerclustern Arbeitslasten in den Namespaces kube-system, gke-system, gke-connect, istio-system und config-management-system. Sie können die Agents wie in den folgenden Abschnitten beschrieben konfigurieren oder deaktivieren.

Der Umfang der erfassten Logs und Messwerte kann auch um Anwendungen erweitert werden. Anleitungen zum Aktivieren von Anwendungs-Logging und -Monitoring finden Sie unter Logging und Monitoring für Nutzeranwendungen aktivieren.

Optimierte Messwerte (Standardmesswerte)

Standardmäßig erfassen die im Cluster ausgeführten Messwert-Agents einen optimierten Satz von Container-, Kubelet- und kube-state-metrics-Messwerten und melden sie an Google Cloud Observability (früher Stackdriver).

Es sind weniger Ressourcen erforderlich, um diese optimierten Messwerte zu erfassen, was die Gesamtleistung und die Skalierbarkeit verbessert. Dies ist aufgrund der großen Anzahl zu überwachender Objekte besonders wichtig für Messwerte auf Container- und Kube-Ebene.

Wenn Sie optimierte Kube-state-metrics-Messwerte deaktivieren möchten (nicht empfohlen), legen Sie das Feld optimizedMetrics in Ihrer benutzerdefinierten Stackdriver-Ressource auf false fest. Weitere Informationen zum Ändern Ihrer benutzerdefinierten Stackdriver-Ressource finden Sie unter Stackdriver-Komponentenressourcen konfigurieren. Alle GKE on VMware-Messwerte, einschließlich der standardmäßig ausgeschlossenen, werden unter GKE Enterprise-Messwerte beschrieben.

Stackdriver aktivieren und deaktivieren

Sie können Logging- und Monitoring-Agents vollständig aktivieren oder deaktivieren. Dazu aktivieren oder deaktivieren Sie die benutzerdefinierte Stackdriver-Ressource. Diese Feature befindet sich im Vorschaumodus.

Bevor Sie die Logging- und Monitoring-Agents deaktivieren, sollten Sie sich auf der Supportseite informieren, wie sich dies auf die SLAs des Google Cloud-Supports auswirkt.

Logging- und Monitoring-Agents erfassen lokal gespeicherte Daten entsprechend Ihrer Speicher- und Aufbewahrungskonfiguration. Die Daten werden in das bei der Installation angegebene Google Cloud-Projekt repliziert. Dazu wird ein Dienstkonto verwendet, das berechtigt ist, Daten in das Projekt zu schreiben. Sie können diese Agents jederzeit deaktivieren, wie zuvor beschrieben.

Sie können auch Daten verwalten und löschen, die von den Logging- und Monitoring-Agents an Cloud Logging und Cloud Monitoring gesendet wurden. Weitere Informationen finden Sie in der Dokumentation zu Cloud Monitoring.

Konfigurationsanforderungen für Logging und Monitoring

Damit Sie Cloud Logging- und Cloud Monitoring-Daten aufrufen können, müssen Sie das Google Cloud-Projekt konfigurieren, in dem die gewünschten Logs und Messwerte gespeichert werden. Dieses Google Cloud-Projekt wird als Logging-Monitoring-Projekt bezeichnet.

  1. Aktivieren Sie die folgenden APIs in Ihrem Logging-Monitoring-Projekt:

  2. Weisen Sie Ihrem Logging-Monitoring-Dienstkonto in Ihrem Logging-Monitoring-Projekt die folgenden IAM-Rollen zu.

    • logging.logWriter
    • monitoring.metricWriter
    • stackdriver.resourceMetadata.writer
    • monitoring.dashboardEditor
    • opsconfigmonitoring.resourceMetadata.writer

Preise

Für GKE Enterprise-Systemlogs und -messwerte fallen keine Gebühren an. Logs der Steuerungsebene, Messwerte der Steuerungsebene und eine kuratierte Teilmenge von Kube-Statusmesswerten sind standardmäßig aktiviert für GKE-Cluster in Google Cloud, die bei der Clustererstellung in einem GKE Enterprise-Projekt registriert werden. Für Logs der Steuerungsebene fallen Cloud Logging-Gebühren an. Messwerte, die standardmäßig aktiviert sind, können kostenlos genutzt werden.

Eine Liste der enthaltenen GKE-Logs und -Messwerte finden Sie unter Verfügbare Logs und Verfügbare Messwerte.

In einem GKE on VMware-Cluster umfassen die Systemlogs und -messwerte von GKE Enterprise Folgendes:

  • Logs und Messwerte aus allen Komponenten in einem Administratorcluster
  • Logs und Messwerte aus Komponenten in diesen Namespaces in einem Nutzercluster:kube-system, gke-system, gke-connect, knative-serving, istio-system, monitoring-system, config-management-system, gatekeeper-system, cnrm-system

Weitere Informationen finden Sie unter Preise für die Google Cloud-Beobachtbarkeit.

Wenn Sie weitere Informationen wünschen und mehr über Guthaben für Cloud Logging-Messwerte wissen möchten, wenden Sie sich an den Vertrieb.

Nächste Schritte