使用 cAdvisor/Kubelet 指标


您可以配置 Google Kubernetes Engine (GKE) 集群,以使用 Google Cloud Managed Service for Prometheus 将一组精选的 cAdvisor/Kubelet 指标发送到 Cloud Monitoring。本文档介绍了这些指标在写入 Cloud Monitoring 时如何设置其格式,以及如何查询这些指标。本文档还提供了一些表,其中列出了每个集合中的指标,并提供了有关如何使用这些指标的信息。

您必须先 启用收集功能,然后才能使用 cAdvisor/Kubelet 指标。

指标格式

写入 Cloud Monitoring 的所有 Kubernetes cAdvisor/Kubelet 指标都使用资源类型 prometheus_target。每个指标名称都以 prometheus.googleapis.com/ 为前缀,并带有表示 Prometheus 指标类型的后缀,例如 /gauge/histogram/counter。否则,每个指标名称都与开源 Kubernetes 公开的指标名称相同。

从 Cloud Monitoring 导出

您可以使用 Cloud Monitoring API 从 Cloud Monitoring 导出 cAdvisor/Kubelet 指标。由于所有 cAdvisor/Kubelet 指标均使用 Google Cloud Managed Service for Prometheus 注入,因此您可以使用 Prometheus Query Language (PromQL) 查询 cAdvisor/Kubelet 指标。您还可以使用 Monitoring Query Language (MQL) 查询它们。

查询指标

查询 cAdvisor/Kubelet 指标时,您使用的名称取决于您使用的是 PromQL 还是基于 Cloud Monitoring 的功能,例如 MQL 或 Metrics Explorer 菜单驱动的界面

以下 cAdvisor/Kubelet 指标表展示了每个指标名称的两个版本:

  • PromQL 指标名称:在 Google Cloud 控制台的 Cloud Monitoring 页面中或 Cloud Monitoring API 的 PromQL 字段中使用 PromQL 时,请使用 PromQL 字段名称。
  • Cloud Monitoring 指标名称:使用其他 Cloud Monitoring 功能时,请使用下表中的 Cloud Monitoring 指标名称。此名称必须以 prometheus.googleapis.com/ 为前缀,表中的条目省略了该前缀。

cAdvisor 指标

此表中的 Cloud Monitoring 指标名称必须以 prometheus.googleapis.com/ 为前缀。表中的条目已省略该前缀。

PromQL 指标名称
Cloud Monitoring 指标名称
种类、类型、单位
受监控的资源
所需的 GKE 版本
说明
标签
container_cpu_cfs_periods_total
container_cpu_cfs_periods_total/counter
CUMULATIVEDOUBLE1
prometheus_target
1.29.3-gke.1093000
已经历的强制执行期间隔数。每 30 秒采样一次。

cpu
container_cpu_cfs_throttled_periods_total
container_cpu_cfs_throttled_periods_total/counter
CUMULATIVEDOUBLE1
prometheus_target
1.29.3-gke.1093000
限制期间隔数。每 30 秒采样一次。

cpu
container_cpu_usage_seconds_total
container_cpu_usage_seconds_total/counter
CUMULATIVEDOUBLEs
prometheus_target
1.29.3-gke.1093000
所使用的累计 CPU 时间。每 30 秒采样一次。

cpu
container_fs_limit_bytes
container_fs_limit_bytes/gauge
GAUGEDOUBLEBy
prometheus_target
1.29.3-gke.1093000
此文件系统上的容器可以使用的字节数量。每 30 秒采样一次。

disk
container_fs_read_seconds_total
container_fs_read_seconds_total/counter
CUMULATIVEDOUBLE1
prometheus_target
1.29.3-gke.1093000
已完成的累计读取数量。每 30 秒采样一次。

diskIO
container_fs_reads_bytes_total
container_fs_reads_bytes_total/counter
CUMULATIVEDOUBLEBy
prometheus_target
1.29.3-gke.1093000
已读取的累计字节数量。每 30 秒采样一次。

diskIO
container_fs_reads_total
container_fs_reads_total/counter
CUMULATIVEDOUBLE1
prometheus_target
1.29.3-gke.1093000
已完成的累计读取数量。每 30 秒采样一次。

diskIO
container_fs_usage_bytes
container_fs_usage_bytes/gauge
GAUGEDOUBLEBy
prometheus_target
1.29.3-gke.1093000
此文件系统上的容器所使用的字节数量。每 30 秒采样一次。

disk
container_fs_write_seconds_total
container_fs_write_seconds_total/counter
CUMULATIVEDOUBLEs
prometheus_target
1.29.3-gke.1093000
写入所花费的累计秒数。每 30 秒采样一次。

diskIO
container_fs_writes_bytes_total
container_fs_writes_bytes_total/counter
CUMULATIVEDOUBLEBy
prometheus_target
1.29.3-gke.1093000
已写入的累计字节数量。每 30 秒采样一次。

diskIO
container_fs_writes_total
container_fs_writes_total/counter
CUMULATIVEDOUBLE1
prometheus_target
1.29.3-gke.1093000
已完成的累计写入数量。每 30 秒采样一次。

diskIO
container_memory_rss
container_memory_rss/gauge
GAUGEDOUBLEBy
prometheus_target
1.29.3-gke.1093000
RSS 的大小。每 30 秒采样一次。

memory
container_memory_working_set_bytes
container_memory_working_set_bytes/gauge
GAUGEDOUBLEBy
prometheus_target
1.29.3-gke.1093000
当前工作集。每 30 秒采样一次。

memory
container_network_receive_bytes_total
container_network_receive_bytes_total/counter
CUMULATIVEDOUBLEBy
prometheus_target
1.29.3-gke.1093000
已接收的累计字节数量。每 30 秒采样一次。

network
container_network_receive_packets_dropped_total
container_network_receive_packets_dropped_total/counter
CUMULATIVEDOUBLE1
prometheus_target
1.29.3-gke.1093000
接收时丢弃的累计数据包数量。每 30 秒采样一次。

network
container_network_receive_packets_total
container_network_receive_packets_total/counter
CUMULATIVEDOUBLE1
prometheus_target
1.29.3-gke.1093000
已接收的累计数据包数量。每 30 秒采样一次。

network
container_network_transmit_bytes_total
container_network_transmit_bytes_total/counter
CUMULATIVEDOUBLEBy
prometheus_target
1.29.3-gke.1093000
已传输的累计字节数量。每 30 秒采样一次。

network
container_network_transmit_packets_dropped_total
container_network_transmit_packets_dropped_total/counter
CUMULATIVEDOUBLE1
prometheus_target
1.29.3-gke.1093000
传输时丢弃的累计数据包数量。每 30 秒采样一次。

network
container_network_transmit_packets_total
container_network_transmit_packets_total/counter
CUMULATIVEDOUBLE1
prometheus_target
1.29.3-gke.1093000
已传输的累计数据包数量。每 30 秒采样一次。

network

Kubelet 指标

此表中的 Cloud Monitoring 指标名称必须以 prometheus.googleapis.com/ 为前缀。表中的条目已省略该前缀。

PromQL 指标名称
Cloud Monitoring 指标名称
种类、类型、单位
受监控的资源
所需的 GKE 版本
说明
标签
kubelet_certificate_manager_server_ttl_seconds
kubelet_certificate_manager_server_ttl_seconds/gauge
GAUGEDOUBLE1
prometheus_target
1.29.3-gke.1093000
Kubelet 服务证书的最短 TTL(存留时间)的采样平均值。该值是证书到期前的秒数(如果已到期,则为负数)。如果服务证书无效或未使用,则该值为 +INF。每 30 秒采样一次。

 
kubelet_node_name
kubelet_node_name/gauge
GAUGEDOUBLE1
prometheus_target
1.29.3-gke.1093000
节点的名称。数量始终为 1。每 30 秒采样一次。

node
kubelet_pleg_relist_duration_seconds
kubelet_pleg_relist_duration_seconds/histogram
CUMULATIVEDISTRIBUTIONs
prometheus_target
1.29.3-gke.1093000
在 PLEG 中重新列出 Pod 的时长(以秒为单位)。每 30 秒采样一次。

 
kubelet_pod_worker_duration_seconds
kubelet_pod_worker_duration_seconds/histogram
CUMULATIVEDISTRIBUTIONs
prometheus_target
1.29.3-gke.1093000
同步单个 Pod 的时长(以秒为单位)。按操作类型细分:创建、更新或同步。每 30 秒采样一次。

operation_type
kubelet_running_containers
kubelet_running_containers/gauge
GAUGEDOUBLE1
prometheus_target
1.29.3-gke.1093000
当前正在运行的容器数量。每 30 秒采样一次。

container_state
kubelet_running_pods
kubelet_running_pods/gauge
GAUGEDOUBLE1
prometheus_target
1.29.3-gke.1093000
具有正在运行的 Pod 沙盒的 Pod 数量。每 30 秒采样一次。

 
kubelet_runtime_operations_total
kubelet_runtime_operations_total/counter
CUMULATIVEDOUBLE1
prometheus_target
1.29.3-gke.1093000
按操作类型划分的累计运行时操作数量。每 30 秒采样一次。

operation_type
kubelet_volume_stats_available_bytes
kubelet_volume_stats_available_bytes/gauge
GAUGEDOUBLE1
prometheus_target
1.29.3-gke.1093000
卷中的可用字节数量。每 30 秒采样一次。

namespace
persistentvolumeclaim
kubelet_volume_stats_capacity_bytes
kubelet_volume_stats_capacity_bytes/gauge
GAUGEDOUBLE1
prometheus_target
1.29.3-gke.1093000
卷的容量(以字节为单位)。每 30 秒采样一次。

namespace
persistentvolumeclaim
kubelet_volume_stats_inodes
kubelet_volume_stats_inodes/gauge
GAUGEDOUBLE1
prometheus_target
1.29.3-gke.1093000
卷中的 inode 数量上限。每 30 秒采样一次。

namespace
persistentvolumeclaim
kubelet_volume_stats_inodes_free
kubelet_volume_stats_inodes_free/gauge
GAUGEDOUBLE1
prometheus_target
1.29.3-gke.1093000
卷中的可用 inode 数量。每 30 秒采样一次。

namespace
persistentvolumeclaim
kubelet_volume_stats_inodes_used
kubelet_volume_stats_inodes_used/gauge
GAUGEDOUBLE1
prometheus_target
1.29.3-gke.1093000
卷中已使用的 inode 数量。每 30 秒采样一次。

namespace
persistentvolumeclaim
kubelet_volume_stats_used_bytes
kubelet_volume_stats_used_bytes/gauge
GAUGEDOUBLE1
prometheus_target
1.29.3-gke.1093000
卷中已使用的字节数量。每 30 秒采样一次。

namespace
persistentvolumeclaim