Auf dieser Seite wird beschrieben, wie Sie Messwerte zum Infrastrukturzustand für Ihre GKE-Cluster und -Arbeitslasten (Google Kubernetes Engine) aufrufen. Diese Messwerte können Ihnen bei der Fehlerbehebung bei Ihren GKE-Clustern und -Arbeitslasten helfen.
Voraussetzungen
- Sie müssen in Ihren Clustern Systemmesswerte aktiviert haben, um die Übersichtsmesswerte auf dem Tab „Beobachtbarkeit“ verwenden zu können. Systemmesswerte sind in Autopilot-Clustern immer und in Standardclustern standardmäßig aktiviert.
- Auf Ihren Clustern müssen Messwerte der Steuerungsebene aktiviert sein, damit die Messwerte der Steuerungsebene auf dem Tab „Beobachtbarkeit“ verwendet werden können. Wenn Sie auf dem Tab Beobachtbarkeit für Ihren Cluster Steuerungsebene auswählen und die Messwerte nicht aktiviert sind, werden Sie per Benachrichtigung informiert, dass die Messwerte nicht aktiviert ist. Sie können sie aktivieren, indem Sie auf Paket aktivieren klicken. Informationen zu anderen Möglichkeiten zum Aktivieren von Messwerten der Steuerungsebene finden Sie unter Sammlung von Messwerten der Steuerungsebene konfigurieren.
Beobachtbarkeitsmesswerte
Auf dem Tab Beobachtbarkeit in der Google Cloud Console können Sie Leistungsmesswerte für Cluster und Arbeitslasten aufrufen.
Bei Google Kubernetes Engine (GKE) Enterprise werden in Diagrammen alle Flotten angezeigt.
Messwerte für Cluster und Arbeitslasten
Die folgenden Messwerte sind sowohl für Cluster als auch für Arbeitslasten verfügbar:
- Übersicht: Zeigt zusammenfassende Messwerte für den Infrastrukturzustand an, z. B. die CPU- und Speicherauslastung, Fehlerlogs und Warnungsereignisse.
- CPU: Zeigt die Auslastung der CPU und der Kernanfragen an.
- Memory: Zeigt die Auslastung der Speicheranfragen an.
Die folgenden Messwerte sind für Cluster verfügbar:
- Kubernetes-Ereignisse: Bietet einen Einblick in die Ereignisanzahl im Zeitverlauf und ein detailliertes Log von Ereignissen.
- Steuerungsebene: Bietet Einblick in den Zustand der Komponenten der Steuerungsebene von Kubernetes, wie z. B. dem kube-apiserver und dem Planer. Außerdem werden Informationen wie die Anzahl der nicht planbaren Pods angezeigt. Bei Pods mit dem Status „Nicht planbar“ wurde die Planung versucht, aber sie haben sich als nicht planbar herausgestellt. Pods mit diesem Status sind ein Zeichen dafür, dass sich im Cluster nichts geändert hat, was sie planbar machen würde.
- Cloud Ops-Aufnahme: Bietet Einblick in den Umfang der Logging- und Messwertaufnahme, die mit den Kosten korreliert. Weitere Informationen finden Sie unter Preise für die Operations-Suite von Google Cloud.
- Sitzungsspezifisch: (verfügbar auf dem Tab Beobachtbarkeit für einen ausgewählten Cluster): bietet Einblick in den sitzungsspezifischen Speicher, der von einem Cluster verwendet wird, sodass Sie feststellen können, ob der Speicher des Clusters effizient genutzt wird. Auf dem Tab Sichtbarkeit der Seite Übersicht werden in einem Diagramm der vom Cluster verwendete sitzungsspezifische Speicher angezeigt. Die Seite Sitzungsspezifisch zeigt zusätzliche Messwerte an, einschließlich Kapazität, Durchsatz, Rate von E/A-Vorgängen und andere. Einige dieser Messwerte sind für Autopilot-Cluster nicht verfügbar.
- Nichtflüchtig:: Bietet Einblick in PersistentVolumes und Ansprüche auf nichtflüchtige Volumes.
- Arbeitslaststatus: Bietet Einblick in die folgenden Ressourcentypen: Pod, Deployment, StatefulSet, DaemonSet und horizontales Pod-Autoscaling.
Beobachtbarkeitsmesswerte interpretieren
Mithilfe von Messwerten können Sie Probleme mit Ihren GKE-Clustern beheben, z. B.:
- Hohe CPU- oder Speicheranfragen-auslastungs-Trends können darauf hindeuten, dass Sie Container in einem Cluster oder Namespace konfigurieren sollten, um weniger Ressourcen zu verwenden.
- Eine hohe Anzahl von Containerneustarts kann auf einen Absturz der Container hinweisen.
- Eine hohe Anzahl nicht planbarer Pods weist auf unzureichende Ressourcen oder Konfigurationsfehler hin.
- Eine hohe Datenaufnahme von Cloud Logging oder Google Cloud Managed Service for Prometheus korreliert mit den Kosten der Operations-Suite von Google Cloud. Sie können die Kosten möglicherweise reduzieren, wenn Sie die Datenaufnahme reduzieren. Weitere Informationen zu Google Cloud Managed Service for Prometheus finden Sie unter Kostenkontrolle und -zuordnung. Weitere Informationen zum Logging finden Sie unter Ausschlussfilter.
Messwerte für Cluster- und Arbeitslast-Beobachtbarkeit aufrufen
Führen Sie die folgenden Schritte in der Google Cloud Console aus, um Beobachtbarkeitsmesswerte für Ihre Cluster oder Arbeitslasten aufzurufen:
Rufen Sie die Seite Kubernetes-Cluster oder Kubernetes-Arbeitslasten auf:
Wählen Sie den Tab Beobachtbarkeit aus.
Wählen Sie den Zeitraum aus, für den die Messwerte aggregiert werden. Ziehen Sie den Mauszeiger in ein Diagramm, um sich auf einen bestimmten Zeitraum zu konzentrieren. Klicken Sie auf Zoom zurücksetzen, um zum zuvor ausgewählten Bereich zurückzukehren.
Führen Sie die folgenden Schritte in der Google Cloud Console aus, um Beobachtbarkeitsmesswerte für einen ausgewählten Cluster oder eine bestimmte Arbeitslast aufzurufen:
Rufen Sie die Seite Kubernetes-Cluster oder Kubernetes-Arbeitslasten auf:
Klicken Sie auf den Namen eines Clusters oder einer Arbeitslast.
Wählen Sie den Tab Beobachtbarkeit aus.
Wählen Sie den Zeitraum aus, für den die Messwerte aggregiert werden. Ziehen Sie den Mauszeiger in ein Diagramm, um sich auf einen bestimmten Zeitraum zu konzentrieren. Klicken Sie auf Zoom zurücksetzen, um zum zuvor ausgewählten Bereich zurückzukehren.
Benutzerdefiniertes Dashboard aus einer ausgewählten Ansicht erstellen
Führen Sie die folgenden Schritte in der Google Cloud Console aus, um die sichtbaren Diagramme einem anpassbaren Dashboard in Cloud Monitoring hinzuzufügen:
Rufen Sie die Seite Kubernetes-Cluster oder Kubernetes-Arbeitslasten auf:
Wählen Sie den Tab Beobachtbarkeit aus.
Wählen Sie optional Filter für die Daten aus.
Klicken Sie auf Als benutzerdefiniertes Dashboard speichern.
Geben Sie einen Namen für das neue Dashboard an.
Klicken Sie auf Senden, um ein neues Dashboard zu erstellen.
Klicken Sie auf In Monitoring ansehen, um das Dashboard aufzurufen.
GKE-Dashboards in Cloud Monitoring aufrufen
Monitoring bietet zusätzliche Dashboards für GKE und andere Google Cloud-Dienste. Sie können die bereitgestellten Dashboards verwenden oder eine Kopie eines Dashboards erstellen, um es an Ihre Anforderungen anzupassen.
Die Dashboard-Liste enthält auch GKE-Playbooks, mit denen Sie gängige Probleme beheben können.
-
Wählen Sie in der Google Cloud Console Monitoring und anschließend Dashboards aus oder klicken Sie auf die folgende Schaltfläche:
Wählen Sie in der Liste der Kategorien GCP aus.
Wählen Sie das Dashboard oder das Playbook aus, das Sie sich ansehen möchten.
- Das GKE-Dashboard bietet einen Überblick über Ihre Cluster, Arbeitslasten, Dienste und andere Ressourcen, die Sie filtern können. Sie können auf eine Ressource klicken, um Details zu Messwerten und Logs aufzurufen. Für Namespaces, Nutzlasten und Kubernetes-Dienste können Sie auch Service Level Objectives (SLOs) aus der Detailansicht anzeigen und erstellen.
- Andere GKE-Dashboards und -Playbooks konzentrieren sich auf bestimmte Ressourcen oder Bedingungen wie gefährdete Arbeitslasten.