Puedes configurar un clúster de Google Kubernetes Engine (GKE) para enviar un conjunto seleccionado de métricas de cAdvisor/Kubelet a Cloud Monitoring mediante Google Cloud Managed Service para Prometheus. En este documento, se describe cómo se formatean estas métricas cuando se escriben en Cloud Monitoring y cómo consultarlas. En este documento, también se proporcionan tablas que enumeran las métricas en cada conjunto y se ofrece información sobre cómo puedes usar estas métricas.
Antes de poder usar las métricas de cAdvisor/Kubelet, debes habilitar su recopilación.
Formato de métrica
Todas las métricas de cAdvisor/Kubelet de Kubernetes escritas en Cloud Monitoring usan el tipo de recurso
prometheus_target
.
Cada nombre de métrica tiene el prefijo prometheus.googleapis.com/
y tiene un sufijo que indica el tipo de métrica de Prometheus, como /gauge
, /histogram
o /counter
. De lo contrario, cada nombre de métrica es idéntico al nombre de la métrica que expone Kubernetes de código abierto.
Exporta desde Cloud Monitoring
Las métricas de cAdvisor/Kubelet se pueden exportar desde Cloud Monitoring mediante la API de Cloud Monitoring. Debido a que todas las métricas de cAdvisor/Kubelet se transfieren mediante Google Cloud Managed Service para Prometheus, las métricas de cAdvisor/Kubelet se pueden consultar a través del lenguaje de consulta de Prometheus (PromQL). También se pueden consultar a través del uso del lenguaje de consulta de Monitoring (MQL).
Consulta métricas
Cuando consultas las métricas de cAdvisor/Kubelet, el nombre que usas depende de si usas funciones basadas en PromQL o Cloud Monitoring, como MQL o la interfaz controlada por menú del Explorador de métricas.
En las siguientes tablas de métricas de cAdvisor/Kubelet, se muestran dos versiones de cada nombre de métrica:
- Nombre de la métrica de PromQL: Cuando usas PromQL en páginas de Cloud Monitoring de la consola de Google Cloud o en campos de PromQL de la API de Cloud Monitoring, usa el nombre de la métrica PromQL.
- Nombre de la métrica de Cloud Monitoring
Cuando uses otras funciones de Cloud Monitoring, usa el nombre de la métrica de Cloud Monitoring en las tablas que aparecen a continuación. Este nombre debe tener el prefijo
prometheus.googleapis.com/
, que se omitió en las entradas de la tabla.
Métricas de cAdvisor
Los nombres de las métricas de Cloud Monitoring en esta tabla deben tener el prefijo prometheus.googleapis.com/
. Este prefijo se omitió en las entradas de la tabla.
Nombre de la métrica de PromQL Nombre de la métrica de Cloud Monitoring |
|
---|---|
Categoría, tipo, unidad
Recursos supervisados Versión de GKE requerida |
Descripción Etiquetas |
container_cpu_cfs_periods_total container_cpu_cfs_periods_total/counter
|
|
CUMULATIVE , DOUBLE , 1
prometheus_target 1.29.3-gke.1093000 |
Cantidad de intervalos de períodos de aplicación transcurridos. Se tomaron muestras cada 30 segundos.cpu
|
container_cpu_cfs_throttled_periods_total container_cpu_cfs_throttled_periods_total/counter
|
|
CUMULATIVE , DOUBLE , 1
prometheus_target 1.29.3-gke.1093000 |
Cantidad de intervalos de períodos regulados. Se tomaron muestras cada 30 segundos.cpu
|
container_cpu_usage_seconds_total container_cpu_usage_seconds_total/counter
|
|
CUMULATIVE , DOUBLE , s
prometheus_target 1.29.3-gke.1093000 |
Tiempo de CPU consumido acumulado. Se tomaron muestras cada 30 segundos.cpu
|
container_fs_limit_bytes container_fs_limit_bytes/gauge
|
|
GAUGE , DOUBLE , By
prometheus_target 1.29.3-gke.1093000 |
Cantidad de bytes que puede consumir el contenedor en este sistema de archivos. Se tomaron muestras cada 30 segundos.disk
|
container_fs_read_seconds_total container_fs_read_seconds_total/counter
|
|
CUMULATIVE , DOUBLE , 1
prometheus_target 1.29.3-gke.1093000 |
Recuento acumulativo de lecturas completadas. Se tomaron muestras cada 30 segundos.diskIO
|
container_fs_reads_bytes_total container_fs_reads_bytes_total/counter
|
|
CUMULATIVE , DOUBLE , By
prometheus_target 1.29.3-gke.1093000 |
Recuento acumulativo de bytes leídos. Se tomaron muestras cada 30 segundos.diskIO
|
container_fs_reads_total container_fs_reads_total/counter
|
|
CUMULATIVE , DOUBLE , 1
prometheus_target 1.29.3-gke.1093000 |
Recuento acumulativo de lecturas completadas. Se tomaron muestras cada 30 segundos.diskIO
|
container_fs_usage_bytes container_fs_usage_bytes/gauge
|
|
GAUGE , DOUBLE , By
prometheus_target 1.29.3-gke.1093000 |
Cantidad de bytes que consume el contenedor en este sistema de archivos. Se tomaron muestras cada 30 segundos.disk
|
container_fs_write_seconds_total container_fs_write_seconds_total/counter
|
|
CUMULATIVE , DOUBLE , s
prometheus_target 1.29.3-gke.1093000 |
Recuento acumulativo de segundos dedicados a la escritura. Se tomaron muestras cada 30 segundos.diskIO
|
container_fs_writes_bytes_total container_fs_writes_bytes_total/counter
|
|
CUMULATIVE , DOUBLE , By
prometheus_target 1.29.3-gke.1093000 |
Recuento acumulativo de bytes escritos. Se tomaron muestras cada 30 segundos.diskIO
|
container_fs_writes_total container_fs_writes_total/counter
|
|
CUMULATIVE , DOUBLE , 1
prometheus_target 1.29.3-gke.1093000 |
Recuento acumulativo de escrituras completadas. Se tomaron muestras cada 30 segundos.diskIO
|
container_memory_rss container_memory_rss/gauge
|
|
GAUGE , DOUBLE , By
prometheus_target 1.29.3-gke.1093000 |
Tamaño del RSS. Se tomaron muestras cada 30 segundos.memory
|
container_memory_working_set_bytes container_memory_working_set_bytes/gauge
|
|
GAUGE , DOUBLE , By
prometheus_target 1.29.3-gke.1093000 |
Conjunto de trabajo actual. Se tomaron muestras cada 30 segundos.memory
|
container_network_receive_bytes_total container_network_receive_bytes_total/counter
|
|
CUMULATIVE , DOUBLE , By
prometheus_target 1.29.3-gke.1093000 |
Recuento acumulativo de bytes recibidos. Se tomaron muestras cada 30 segundos.network
|
container_network_receive_packets_dropped_total container_network_receive_packets_dropped_total/counter
|
|
CUMULATIVE , DOUBLE , 1
prometheus_target 1.29.3-gke.1093000 |
Recuento acumulativo de paquetes descartados durante la recepción.
Se tomaron muestras cada 30 segundos.network
|
container_network_receive_packets_total container_network_receive_packets_total/counter
|
|
CUMULATIVE , DOUBLE , 1
prometheus_target 1.29.3-gke.1093000 |
Recuento acumulativo de paquetes recibidos. Se tomaron muestras cada 30 segundos.network
|
container_network_transmit_bytes_total container_network_transmit_bytes_total/counter
|
|
CUMULATIVE , DOUBLE , By
prometheus_target 1.29.3-gke.1093000 |
Recuento acumulativo de bytes transmitidos. Se tomaron muestras cada 30 segundos.network
|
container_network_transmit_packets_dropped_total container_network_transmit_packets_dropped_total/counter
|
|
CUMULATIVE , DOUBLE , 1
prometheus_target 1.29.3-gke.1093000 |
Recuento acumulativo de paquetes descartados durante la transmisión.
Se tomaron muestras cada 30 segundos.network
|
container_network_transmit_packets_total container_network_transmit_packets_total/counter
|
|
CUMULATIVE , DOUBLE , 1
prometheus_target 1.29.3-gke.1093000 |
Recuento acumulativo de paquetes transmitidos. Se tomaron muestras cada 30 segundos.network
|
Métricas de Kubelet
Los nombres de las métricas de Cloud Monitoring en esta tabla deben tener el prefijo prometheus.googleapis.com/
. Este prefijo se omitió en las entradas de la tabla.
Nombre de la métrica de PromQL Nombre de la métrica de Cloud Monitoring |
|
---|---|
Categoría, tipo, unidad
Recursos supervisados Versión de GKE requerida |
Descripción Etiquetas |
kubelet_certificate_manager_server_ttl_seconds kubelet_certificate_manager_server_ttl_seconds/gauge
|
|
GAUGE , DOUBLE , 1
prometheus_target 1.29.3-gke.1093000 |
Indicador del TTL (tiempo de actividad) más corto del certificado de entrega de Kubelet. El valor está en segundos hasta el vencimiento del certificado (negativo si ya venció). Si el certificado de entrega no es válido o no se usa, el valor será +INF. Se tomaron muestras cada 30 segundos. |
kubelet_node_name kubelet_node_name/gauge
|
|
GAUGE , DOUBLE , 1
prometheus_target 1.29.3-gke.1093000 |
El nombre del nodo. El recuento es siempre 1. Se tomaron muestras cada 30 segundos.node
|
kubelet_pleg_relist_duration_seconds kubelet_pleg_relist_duration_seconds/histogram
|
|
CUMULATIVE , DISTRIBUTION , s
prometheus_target 1.29.3-gke.1093000 |
Duración en segundos para volver a mostrar los Pods en PLEG. Se tomaron muestras cada 30 segundos. |
kubelet_pod_worker_duration_seconds kubelet_pod_worker_duration_seconds/histogram
|
|
CUMULATIVE , DISTRIBUTION , s
prometheus_target 1.29.3-gke.1093000 |
Duración en segundos para sincronizar un solo Pod. Se desglosa por tipo de operación: creación, actualización o sincronización. Se tomaron muestras cada 30 segundos.operation_type
|
kubelet_running_containers kubelet_running_containers/gauge
|
|
GAUGE , DOUBLE , 1
prometheus_target 1.29.3-gke.1093000 |
Cantidad de contenedores que se ejecutan actualmente. Se tomaron muestras cada 30 segundos.container_state
|
kubelet_running_pods kubelet_running_pods/gauge
|
|
GAUGE , DOUBLE , 1
prometheus_target 1.29.3-gke.1093000 |
Cantidad de Pods que tienen una zona de pruebas de Pods en ejecución. Se tomaron muestras cada 30 segundos. |
kubelet_runtime_operations_total kubelet_runtime_operations_total/counter
|
|
CUMULATIVE , DOUBLE , 1
prometheus_target 1.29.3-gke.1093000 |
Cantidad acumulativa de operaciones del entorno de ejecución por tipo de operación.
Se tomaron muestras cada 30 segundos.operation_type
|
kubelet_volume_stats_available_bytes kubelet_volume_stats_available_bytes/gauge
|
|
GAUGE , DOUBLE , 1
prometheus_target 1.29.3-gke.1093000 |
Cantidad de bytes disponibles en el volumen. Se tomaron muestras cada 30 segundos.namespace
persistentvolumeclaim
|
kubelet_volume_stats_capacity_bytes kubelet_volume_stats_capacity_bytes/gauge
|
|
GAUGE , DOUBLE , 1
prometheus_target 1.29.3-gke.1093000 |
Capacidad en bytes del volumen. Se tomaron muestras cada 30 segundos.namespace
persistentvolumeclaim
|
kubelet_volume_stats_inodes kubelet_volume_stats_inodes/gauge
|
|
GAUGE , DOUBLE , 1
prometheus_target 1.29.3-gke.1093000 |
Cantidad máxima de inodos en el volumen. Se tomaron muestras cada 30 segundos.namespace
persistentvolumeclaim
|
kubelet_volume_stats_inodes_free kubelet_volume_stats_inodes_free/gauge
|
|
GAUGE , DOUBLE , 1
prometheus_target 1.29.3-gke.1093000 |
Cantidad de inodos libres en el volumen. Se tomaron muestras cada 30 segundos.namespace
persistentvolumeclaim
|
kubelet_volume_stats_inodes_used kubelet_volume_stats_inodes_used/gauge
|
|
GAUGE , DOUBLE , 1
prometheus_target 1.29.3-gke.1093000 |
Cantidad de inodos usados en el volumen. Se tomaron muestras cada 30 segundos.namespace
persistentvolumeclaim
|
kubelet_volume_stats_used_bytes kubelet_volume_stats_used_bytes/gauge
|
|
GAUGE , DOUBLE , 1
prometheus_target 1.29.3-gke.1093000 |
Cantidad de bytes usados en el volumen. Se tomaron muestras cada 30 segundos.namespace
persistentvolumeclaim
|