cAdvisor-/Kubelet-Messwerte erfassen und ansehen


Auf dieser Seite wird beschrieben, wie Sie einen GKE-Cluster (Google Kubernetes Engine) konfigurieren, um mithilfe von Google Cloud Managed Service for Prometheus eine ausgewählte Gruppe von cAdvisor-/Kubelet-Messwerten an Cloud Monitoring zu senden. Auf dieser Seite wird auch beschrieben, wie diese Messwerte formatiert werden, wenn sie in Monitoring geschrieben und Messwerte abgefragt werden.

Die ausgewählten Messwerte sind eine Teilmenge der cAdvisor-/Kubelet-Messwerte, die standardmäßig in jede Kubernetes-Bereitstellung integriert sind und Messwerte zur Reduzierung des Aufnahmevolumens und der damit verbundenen Kosten umfassen.

Hinweise

Führen Sie die folgenden Schritte durch, bevor Sie beginnen:

  • Aktivieren Sie die Google Kubernetes Engine API.
  • Google Kubernetes Engine API aktivieren
  • Wenn Sie die Google Cloud CLI für diese Aufgabe verwenden möchten, müssen Sie die gcloud CLI installieren und dann initialisieren. Wenn Sie die gcloud CLI bereits installiert haben, rufen Sie die neueste Version mit gcloud components update ab.

Voraussetzungen

Zum Erfassen von cAdvisor-/Kubelet-Messwerten muss Ihr GKE-Cluster die folgenden Anforderungen erfüllen:

  • Der Cluster muss die GKE-Version 1.29.3-gke.1093000 oder höher ausführen.
  • Für den Cluster müssen Systemmesswerte aktiviert sein. Systemmesswerte sind standardmäßig aktiviert, wenn Sie einen Cluster mit Version 1.29.3-gke.1093000 oder höher erstellen.
  • Im Cluster ist die von Google Cloud Managed Service for Prometheus-verwaltete Erfassung aktiviert. Die verwaltete Sammlung ist standardmäßig aktiviert, wenn Sie einen Cluster mit Version 1.29.3-gke.1093000 oder höher erstellen.

Erfassung von cAdvisor-/Kubelet-Messwerten konfigurieren

Sie können cAdvisor-/Kubelet-Messwerte in einem vorhandenen GKE-Cluster mit der Google Cloud Console, der gcloud CLI oder Terraform aktivieren.

Console

So konfigurieren Sie cAdvisor-/Kubelet-Messwerte auf dem Tab Details für den Cluster:

  1. Rufen Sie in der Google Cloud Console die Seite mit den Kubernetes-Clustern auf.

    Zur Seite Kubernetes-Cluster

    Wenn Sie diese Seite über die Suchleiste finden, wählen Sie das Ergebnis aus, dessen Zwischenüberschrift Kubernetes Engine ist.

  2. Klicken Sie auf den Namen Ihres Clusters.

  3. Klicken Sie in der Zeile Funktionen mit der Bezeichnung Cloud Monitoring auf das Symbol Bearbeiten.

  4. Prüfen Sie im angezeigten Dialogfeld Cloud Monitoring bearbeiten, ob Cloud Monitoring aktivieren ausgewählt ist.

  5. Wählen Sie im Drop-down-Menü Komponenten die cAdvisor-/Kubelet-Komponenten aus, aus denen Sie Messwerte erfassen möchten:

    • cAdvisor
    • Kubelet
  6. Klicken Sie auf OK.

  7. Klicken Sie auf Änderungen speichern.

gcloud

Aktualisieren Sie den Cluster, um Messwerte zu erfassen:

gcloud container clusters update CLUSTER_NAME \
    --location=COMPUTE_LOCATION \
    --enable-managed-prometheus \
    --monitoring=SYSTEM,CADVISOR,KUBELET

Ersetzen Sie Folgendes:

Der Satz von Werten, der für das Flag monitoring angegeben ist, überschreibt alle vorherigen Einstellungen.

Terraform

Informationen zum Konfigurieren der Sammlung von cAdvisor-/Kubelet-Messwerten mit Terraform finden Sie im Block monitoring_config in der Terraform-Registry für google_container_cluster. Allgemeine Informationen zur Verwendung von Google Cloud mit Terraform finden Sie unter Terraform mit Google Cloud.

Messwertformat

Alle in Cloud Monitoring geschriebenen cAdvisor-/Kubelet-Messwerte von Kubernetes verwenden den Ressourcentyp prometheus_target. Jeder Messwertname hat das Präfix prometheus.googleapis.com/ und ein Suffix, das den Prometheus-Messwerttyp angibt, z. B. /gauge, /histogram oder /counter. Andernfalls ist jeder Messwertname mit dem Messwert von Open-Source-Kubernetes identisch.

Aus Cloud Monitoring exportieren

Die cAdvisor-/Kubelet-Messwerte können mithilfe der Cloud Monitoring API aus Cloud Monitoring exportiert werden. Da alle cAdvisor-/Kubelet-Messwerte mit Google Cloud Managed Service for Prometheus aufgenommen werden, können cAdvisor-/Kubelet-Messwerte mit der Prometheus-Abfragesprache (PromQL) abgefragt werden. Eine Abfrage ist auch mit Monitoring Query Language (MQL) möglich.

Messwerte abfragen

Wenn Sie cAdvisor/Kubelet-Messwerte abfragen, hängt der Name davon ab, ob Sie PromQL- oder Cloud Monitoring-basierte Features wie MQL oder die menügesteuerte Oberfläche des Metrics Explorer verwenden.

Die folgenden Tabellen der cAdvisor-/Kubelet-Messwerte zeigen zwei Versionen jedes Messwertnamens:

  • PromQL-Messwertname: Bei der Verwendung von PromQL auf Cloud Monitoring-Seiten der Google Cloud Console oder in PromQL-Feldern des Cloud Monitoring API verwenden Sie den PromQL-Messwertnamen.
  • Name des Cloud Monitoring-Messwerts: Verwenden Sie in den folgenden Tabellen den Cloud Monitoring-Messwertnamen, wenn Sie andere Cloud Monitoring-Features verwenden. Dieser Name muss das Präfix prometheus.googleapis.com/ haben, das in den Einträgen der Tabelle weggelassen wurde.

cAdvisor-Messwerte

Die Cloud Monitoring-Messwertnamen in dieser Tabelle müssen das Präfix prometheus.googleapis.com/ haben. Dieses Präfix wurde in den Einträgen der Tabelle weggelassen.

PromQL-Messwertname
Cloud Monitoring-Messwertname
Art, Typ, Einheit
Überwachte Ressourcen
Erforderliche GKE-Version
Beschreibung
Labels
container_cpu_cfs_periods_total
container_cpu_cfs_periods_total/counter
CUMULATIVEDOUBLE1
prometheus_target
1.29.3-gke.1093000
Anzahl der verstrichenen Intervalle für die Erzwingung. Alle 30 Sekunden wird eine Stichprobe erstellt.

cpu
container_cpu_cfs_throttled_periods_total
container_cpu_cfs_throttled_periods_total/counter
CUMULATIVEDOUBLE1
prometheus_target
1.29.3-gke.1093000
Anzahl der gedrosselten Zeitraumintervalle. Alle 30 Sekunden wird eine Stichprobe erstellt.

cpu
container_cpu_usage_seconds_total
container_cpu_usage_seconds_total/counter
CUMULATIVEDOUBLEs
prometheus_target
1.29.3-gke.1093000
Kumulative CPU-Zeit, die verbraucht wurde. Alle 30 Sekunden wird eine Stichprobe erstellt.

cpu
container_fs_limit_bytes
container_fs_limit_bytes/gauge
GAUGEDOUBLEBy
prometheus_target
1.29.3-gke.1093000
Anzahl der Byte, die vom Container in diesem Dateisystem genutzt werden können. Alle 30 Sekunden wird eine Stichprobe erstellt.

disk
container_fs_read_seconds_total
container_fs_read_seconds_total/counter
CUMULATIVEDOUBLE1
prometheus_target
1.29.3-gke.1093000
Kumulative Anzahl der abgeschlossenen Lesevorgänge. Alle 30 Sekunden wird eine Stichprobe erstellt.

diskIO
container_fs_reads_bytes_total
container_fs_reads_bytes_total/counter
CUMULATIVEDOUBLEBy
prometheus_target
1.29.3-gke.1093000
Kumulative Anzahl der gelesenen Byte. Alle 30 Sekunden wird eine Stichprobe erstellt.

diskIO
container_fs_reads_total
container_fs_reads_total/counter
CUMULATIVEDOUBLE1
prometheus_target
1.29.3-gke.1093000
Kumulative Anzahl der abgeschlossenen Lesevorgänge. Alle 30 Sekunden wird eine Stichprobe erstellt.

diskIO
container_fs_usage_bytes
container_fs_usage_bytes/gauge
GAUGEDOUBLEBy
prometheus_target
1.29.3-gke.1093000
Anzahl der Byte, die vom Container in diesem Dateisystem genutzt werden. Alle 30 Sekunden wird eine Stichprobe erstellt.

disk
container_fs_write_seconds_total
container_fs_write_seconds_total/counter
CUMULATIVEDOUBLEs
prometheus_target
1.29.3-gke.1093000
Kumulative Anzahl der Sekunden, die mit dem Schreiben verbracht wurden. Alle 30 Sekunden wird eine Stichprobe erstellt.

diskIO
container_fs_writes_bytes_total
container_fs_writes_bytes_total/counter
CUMULATIVEDOUBLEBy
prometheus_target
1.29.3-gke.1093000
Kumulative Anzahl der geschriebenen Byte. Alle 30 Sekunden wird eine Stichprobe erstellt.

diskIO
container_fs_writes_total
container_fs_writes_total/counter
CUMULATIVEDOUBLE1
prometheus_target
1.29.3-gke.1093000
Kumulative Anzahl abgeschlossener Schreibvorgänge. Alle 30 Sekunden wird eine Stichprobe erstellt.

diskIO
container_memory_rss
container_memory_rss/gauge
GAUGEDOUBLEBy
prometheus_target
1.29.3-gke.1093000
Größe von RSS. Alle 30 Sekunden wird eine Stichprobe erstellt.

memory
container_memory_working_set_bytes
container_memory_working_set_bytes/gauge
GAUGEDOUBLEBy
prometheus_target
1.29.3-gke.1093000
Aktuelles Arbeitsset. Alle 30 Sekunden wird eine Stichprobe erstellt.

memory
container_network_receive_bytes_total
container_network_receive_bytes_total/counter
CUMULATIVEDOUBLEBy
prometheus_target
1.29.3-gke.1093000
Kumulative Anzahl der empfangenen Byte. Alle 30 Sekunden wird eine Stichprobe erstellt.

network
container_network_receive_packets_dropped_total
container_network_receive_packets_dropped_total/counter
CUMULATIVEDOUBLE1
prometheus_target
1.29.3-gke.1093000
Kumulative Anzahl der Pakete, die während des Empfangs verworfen wurden. Alle 30 Sekunden wird eine Stichprobe erstellt.

network
container_network_receive_packets_total
container_network_receive_packets_total/counter
CUMULATIVEDOUBLE1
prometheus_target
1.29.3-gke.1093000
Kumulative Anzahl der empfangenen Pakete. Alle 30 Sekunden wird eine Stichprobe erstellt.

network
container_network_transmit_bytes_total
container_network_transmit_bytes_total/counter
CUMULATIVEDOUBLEBy
prometheus_target
1.29.3-gke.1093000
Kumulative Anzahl der übertragenen Byte. Alle 30 Sekunden wird eine Stichprobe erstellt.

network
container_network_transmit_packets_dropped_total
container_network_transmit_packets_dropped_total/counter
CUMULATIVEDOUBLE1
prometheus_target
1.29.3-gke.1093000
Kumulative Anzahl der Pakete, die während der Übertragung verworfen wurden. Alle 30 Sekunden wird eine Stichprobe erstellt.

network
container_network_transmit_packets_total
container_network_transmit_packets_total/counter
CUMULATIVEDOUBLE1
prometheus_target
1.29.3-gke.1093000
Kumulative Anzahl der übertragenen Pakete. Alle 30 Sekunden wird eine Stichprobe erstellt.

network

Kubelet-Messwerte

Die Cloud Monitoring-Messwertnamen in dieser Tabelle müssen das Präfix prometheus.googleapis.com/ haben. Dieses Präfix wurde in den Einträgen der Tabelle weggelassen.

PromQL-Messwertname
Cloud Monitoring-Messwertname
Art, Typ, Einheit
Überwachte Ressourcen
Erforderliche GKE-Version
Beschreibung
Labels
kubelet_certificate_manager_server_ttl_seconds
kubelet_certificate_manager_server_ttl_seconds/gauge
GAUGEDOUBLE1
prometheus_target
1.29.3-gke.1093000
Anzeige der kürzesten TTL (Time To Live, Gültigkeitsdauer) des Bereitstellungszertifikats des Kubelet. Der Wert wird in Sekunden bis zum Ablauf des Zertifikats angegeben (negativ, wenn bereits abgelaufen). Wenn das bereitgestellte Zertifikat ungültig oder nicht verwendet wird, lautet der Wert +INF. Alle 30 Sekunden wird eine Stichprobe erstellt.

 
kubelet_node_name
kubelet_node_name/gauge
GAUGEDOUBLE1
prometheus_target
1.29.3-gke.1093000
Der Name des Knotens. Die Anzahl ist immer 1. Alle 30 Sekunden wird eine Stichprobe erstellt.

node
kubelet_pleg_relist_duration_seconds
kubelet_pleg_relist_duration_seconds/histogram
CUMULATIVEDISTRIBUTIONs
prometheus_target
1.29.3-gke.1093000
Dauer in Sekunden für das neue Auflisten von Pods im PLEG. Alle 30 Sekunden wird eine Stichprobe erstellt.

 
kubelet_pod_worker_duration_seconds
kubelet_pod_worker_duration_seconds/histogram
CUMULATIVEDISTRIBUTIONs
prometheus_target
1.29.3-gke.1093000
Dauer der Synchronisierung eines einzelnen Pods in Sekunden. Aufschlüsselung nach Vorgangstyp: Erstellen, Aktualisieren oder Synchronisieren. Alle 30 Sekunden wird eine Stichprobe erstellt.

operation_type
kubelet_running_containers
kubelet_running_containers/gauge
GAUGEDOUBLE1
prometheus_target
1.29.3-gke.1093000
Anzahl der aktuell ausgeführten Container. Alle 30 Sekunden wird eine Stichprobe erstellt.

container_state
kubelet_running_pods
kubelet_running_pods/gauge
GAUGEDOUBLE1
prometheus_target
1.29.3-gke.1093000
Anzahl der Pods mit einer ausgeführten Pod-Sandbox. Alle 30 Sekunden wird eine Stichprobe erstellt.

 
kubelet_runtime_operations_total
kubelet_runtime_operations_total/counter
CUMULATIVEDOUBLE1
prometheus_target
1.29.3-gke.1093000
Kumulative Anzahl der Laufzeitvorgänge nach Vorgangstyp. Alle 30 Sekunden wird eine Stichprobe erstellt.

operation_type
kubelet_volume_stats_available_bytes
kubelet_volume_stats_available_bytes/gauge
GAUGEDOUBLE1
prometheus_target
1.29.3-gke.1093000
Anzahl der verfügbaren Byte im Volume. Alle 30 Sekunden wird eine Stichprobe erstellt.

namespace
persistentvolumeclaim
kubelet_volume_stats_capacity_bytes
kubelet_volume_stats_capacity_bytes/gauge
GAUGEDOUBLE1
prometheus_target
1.29.3-gke.1093000
Kapazität des Volumes in Byte. Alle 30 Sekunden wird eine Stichprobe erstellt.

namespace
persistentvolumeclaim
kubelet_volume_stats_inodes
kubelet_volume_stats_inodes/gauge
GAUGEDOUBLE1
prometheus_target
1.29.3-gke.1093000
Maximale Anzahl von Inodes im Volume. Alle 30 Sekunden wird eine Stichprobe erstellt.

namespace
persistentvolumeclaim
kubelet_volume_stats_inodes_free
kubelet_volume_stats_inodes_free/gauge
GAUGEDOUBLE1
prometheus_target
1.29.3-gke.1093000
Anzahl der freien Inodes im Volume. Alle 30 Sekunden wird eine Stichprobe erstellt.

namespace
persistentvolumeclaim
kubelet_volume_stats_inodes_used
kubelet_volume_stats_inodes_used/gauge
GAUGEDOUBLE1
prometheus_target
1.29.3-gke.1093000
Anzahl der verwendeten Inodes im Volume. Alle 30 Sekunden wird eine Stichprobe erstellt.

namespace
persistentvolumeclaim
kubelet_volume_stats_used_bytes
kubelet_volume_stats_used_bytes/gauge
GAUGEDOUBLE1
prometheus_target
1.29.3-gke.1093000
Anzahl der verwendeten Byte im Volume. Alle 30 Sekunden wird eine Stichprobe erstellt.

namespace
persistentvolumeclaim