Métricas de uso de recursos de flotas

En esta página, se profundiza en las métricas de uso de recursos de la flota y el equipo. Se explica cómo se calculan estas métricas y se proporcionan sugerencias para usarlas con el objetivo de optimizar el uso de recursos.

Puedes ver estas métricas en los siguientes paneles:

Estas métricas describen la eficacia con la que tus clústeres usan los recursos que pagas y que están disponibles de forma física o los recursos que asignas en el hardware local. Puedes usar esta información para comprender la eficacia del uso de recursos a gran escala, a nivel del alcance de la flota o del equipo. Esto puede ayudarte a optimizar el tamaño del clúster y la asignación de recursos en los clústeres y espacios de nombres o a optimizar la forma en la que los equipos de aplicaciones solicitan y reservan recursos.

Usa métricas de uso de recursos

Las siguientes sugerencias pueden ayudarte a usar las métricas en la consola para identificar y abordar problemas:

  • Si el Uso total de CPU, memoria o disco de tu flota indica un uso que de forma inesperada es alto o bajo durante los últimos siete días, siempre comprueba el uso de CPU, memoria o disco por flota correspondiente. para evaluar si el uso inesperado es constante o si se debe a aumentos repentinos de uso.
  • Si el Uso principal de CPU, memoria o disco por clúster indica que los clústeres individuales se comportan de manera diferente al resto, considera investigar esos clústeres en particular con mayor detenimiento. Si es posible, considera cambiar el tamaño de los clústeres.
  • Si el Uso principal de CPU, memoria o disco por espacio de nombres muestra un aumento repentino durante los últimos siete días, considera investigar si una carga de trabajo específica está causando el aumento. Una solución posible puede ser redistribuir las cargas de trabajo entre los recursos.
  • El uso de CPU, memoria o disco por flota te permite observar la proporción entre los recursos usados y los solicitados. Una gran diferencia entre ambos puede significar que los equipos de aplicaciones solicitan y reservan demasiados recursos.

Información sobre las métricas de uso de recursos

Las siguientes métricas figuran en los paneles de descripción general del alcance de la flota, de GKE Enterprise y el equipo, que se calculan con la información de Cloud Monitoring en los clústeres de tu flota.

Puedes ver las métricas a nivel de la flota en los paneles de GKE Enterprise y de descripción general de la flota. Las métricas a nivel del equipo están disponibles en los paneles de GKE Enterprise y de descripción general del equipo.

Métricas de CPU

  • Uso total de CPU:
    • Para las métricas a nivel de flota, un promedio de todos los puntos en el tiempo durante un período determinado en el que un momento determinado es una proporción entre los recursos asignables y usados en todos los clústeres que están registrados en una flota.
      • Asignable: la cantidad de CPU asignada a todos los nodos en todos los clústeres que están registrados en una flota. Se calcula a partir de la métrica node/cpu/allocatable_cores.
      • Usado: la cantidad de CPU que usan todos los contenedores en todos los clústeres que se registran en una flota. Se calcula a partir de la métrica container/cpu/core_usage_time.
    • Para el panel de Monitoringdel equipo, un promedio de todos los puntos en el tiempo para un período determinado en el que un momento determinado es una proporción entre los recursos solicitados y usados en todos los espacios de nombres asociados con un alcance del equipo.
      • Solicitada: la cantidad de CPU solicitada por todos los contenedores en todos los espacios de nombres asociados con un alcance del equipo. Se calcula a partir de la métrica container/cpu/request_cores.
      • Usado: la cantidad de CPU que usan todos los contenedores en todos los espacios de nombres asociados con un alcance de equipo. Se calcula a partir de la métrica container/cpu/core_usage_time.
  • Uso de CPU por flota o equipo:
    • Para el nivel de flota, la relación entre los recursos usados, solicitados y asignados.
      • Usado: la cantidad de CPU que usan todos los contenedores en todos los clústeres que se registran en una flota. Se calcula a partir de la métrica container/cpu/core_usage_time.
      • Solicitada: la cantidad de CPU solicitada por todos los contenedores en todos los clústeres que están registrados en una flota. Se calcula a partir de la métrica container/cpu/request_cores.
      • Asignable: la cantidad de CPU asignada a todos los nodos en todos los clústeres que están registrados en una flota. Se calcula a partir de la métrica node/cpu/allocatable_cores.
    • Para el nivel de equipo, la relación entre el límite de recursos y los recursos usados y solicitados.
      • Usado: la cantidad de CPU que usan todos los contenedores en todos los espacios de nombres asociados con un alcance de equipo. Se calcula a partir de la métrica container/cpu/core_usage_time.
      • Solicitada: la cantidad de CPU solicitada por todos los contenedores en todos los espacios de nombres asociados con un alcance del equipo. Se calcula a partir de la métrica container/cpu/request_cores.
      • Límite: la cantidad máxima de CPU disponible para todos los contenedores en todos los espacios de nombres asociados con un alcance del equipo. Se calcula a partir de la métrica container/cpu/limit_cores.
  • Uso de CPU principal por clúster: lista de clústeres ordenada por un promedio de todos los puntos en el tiempo durante un período determinado en el que un momento determinado es una proporción entre los recursos asignables y usados para un particular clúster.
    • Asignable: la cantidad de CPU asignada a todos los nodos del clúster. Se calcula a partir de la métrica node/cpu/allocatable_cores.
    • Usado: la cantidad de CPU que usan todos los contenedores en un clúster. Se calcula a partir de la métrica container/cpu/core_usage_time.
  • Uso de CPU principal por espacio de nombres: lista de espacios de nombres ordenada por un promedio de todos los puntos en el tiempo para un período determinado en el que un momento determinado es una proporción entre los recursos usados y solicitados para un particular espacio de nombres.
    • Usado: la cantidad de CPU que usan todos los contenedores en un espacio de nombres. Se calcula a partir de la métrica container/cpu/core_usage_time.
    • Solicitada: la cantidad de CPU solicitada por todos los contenedores en un espacio de nombres. Se calcula a partir de la métrica container/cpu/request_cores.

Métricas de memoria

  • Uso total de la memoria:
    • Para las métricas a nivel de flota, esto se refiere a un promedio de todos los puntos en el tiempo durante un período determinado en el que un momento determinado es una proporción entre los recursos asignables y usados en todos los clústeres que pertenecen a una flota.
      • Asignable: la cantidad de memoria asignada a todos los nodos de todos los clústeres que están registrados en una flota. Se calcula a partir de la métrica node/memory/allocatable_byte.
      • Usado: la cantidad de memoria no expulsable que usan todos los contenedores en todos los clústeres que están registrados en una flota. Se calcula a partir de la métrica container/memory/used_bytes.
    • Para las métricas a nivel de equipo, esto se refiere a un promedio de todos los puntos en el tiempo para un período determinado en el que un momento determinado es una proporción entre los recursos solicitados y usados en todos los espacios de nombres que pertenecen a un alcance del equipo.
      • Solicitada: la cantidad de memoria solicitada por todos los contenedores en todos los espacios de nombres asociados con un alcance. Se calcula a partir de la métrica container/memory/request_bytes.
      • Usado: la cantidad de memoria no expulsable que usan todos los contenedores en todos los espacios de nombres asociados con un alcance. Se calcula a partir de la métrica container/memory/used_bytes.
  • Uso de memoria por flota o equipo:
    • Para el nivel de flota, la relación entre los recursos usados, solicitados y asignados.
      • Usado: la cantidad de memoria no expulsable que usan todos los contenedores en todos los clústeres que están registrados en una flota. Se calcula a partir de la métrica container/memory/used_bytes.
      • Solicitada: la cantidad de memoria solicitada por todos los contenedores en todos los clústeres que están registrados en una flota. Se calcula a partir de la métrica container/memory/request_bytes.
      • Asignable: la cantidad de memoria asignada a todos los nodos de todos los clústeres que están registrados en una flota. Se calcula a partir de la métrica node/memory/allocatable_byte.
    • Para el nivel de equipo, la relación entre el límite de recursos y los recursos usados y solicitados.
      • Usado: la cantidad de memoria no expulsable que usan todos los contenedores en todos los espacios de nombres asociados con un alcance. Se calcula a partir de la métrica container/memory/used_bytes.
      • Solicitada: la cantidad de memoria solicitada por todos los contenedores en todos los espacios de nombres asociados con un alcance. Se calcula a partir de la métrica container/memory/request_bytes.
      • Límite: la cantidad máxima de memoria disponible para todos los contenedores en todos los espacios de nombres asociados con un alcance. Se calcula a partir de la métrica container/memory/limit_bytes.
  • Uso de memoria principal por clúster: lista de clústeres ordenada por un promedio de todos los puntos en el tiempo durante un período determinado en el que un momento determinado es una proporción entre los recursos asignables y usados para un particular clúster.
    • Asignable: la cantidad de memoria asignada a todos los nodos del clúster. Se calcula a partir de la métrica node/memory/allocatable_byte.
    • Usado: la cantidad de memoria no expulsable que usan todos los contenedores en un clúster. Se calcula a partir de la métrica container/memory/used_bytes.
  • Uso de memoria principal por espacio de nombres: lista de espacios de nombres ordenada por un promedio de todos los puntos en el tiempo para un período determinado en el que un momento determinado es una proporción entre los recursos usados y solicitados para un particular espacio de nombres.
    • Usado: la cantidad de memoria no expulsable que usan todos los contenedores en un espacio de nombres. Se calcula a partir de la métrica container/memory/used_bytes.
    • Solicitada: la cantidad de memoria solicitada por todos los contenedores en un espacio de nombres. Se calcula a partir de la métrica container/memory/request_bytes.

Métricas de disco

  • Uso total del disco:
    • Para las métricas a nivel de flota, esto se refiere a un promedio de todos los puntos en el tiempo durante un período determinado en el que un momento determinado es una proporción entre los recursos asignables y usados en todos los clústeres que pertenecen a una flota.
      • Asignable: la cantidad de almacenamiento efímero local asignado a todos los nodos de todos los clústeres que están registrados en una flota. Se calcula a partir de la métrica node/ephemeral_storage/allocatable_bytes.
      • Usado: la cantidad de almacenamiento efímero local que usan todos los contenedores en todos los clústeres que están registrados en una flota. Se calcula a partir de la métrica container/ephemeral_storage/used_bytes.
    • Para las métricas a nivel de equipo, esto se refiere a un promedio de todos los puntos en el tiempo para un período determinado en el que un momento determinado es una proporción entre los recursos solicitados y usados en todos los espacios de nombres que pertenecen a un alcance del equipo.
      • Solicitado: la cantidad de almacenamiento efímero local que solicitan todos los contenedores en todos los espacios de nombres asociados con un alcance. Se calcula a partir de la métrica container/ephemeral_storage/request_bytes.
      • Usado: la cantidad de almacenamiento efímero local que usan todos los contenedores en todos los espacios de nombres asociados con un alcance. Se calcula a partir de la métrica container/ephemeral_storage/used_bytes.
  • Uso de disco por flota o equipo:
    • Para el nivel de flota, la relación entre los recursos usados, solicitados y asignados.
      • Usado: la cantidad de almacenamiento efímero local que usan todos los contenedores en todos los clústeres que están registrados en una flota. Se calcula a partir de la métrica container/ephemeral_storage/used_bytes.
      • Solicitado: la cantidad de almacenamiento efímero local que solicitan todos los contenedores en todos los clústeres que están registrados en una flota. Se calcula a partir de la métrica container/ephemeral_storage/request_bytes.
      • Asignable: la cantidad de almacenamiento efímero local asignado a todos los nodos de todos los clústeres que están registrados en una flota. Se calcula a partir de la métrica node/ephemeral_storage/allocatable_bytes.
    • Para el nivel de equipo, la relación entre el límite de recursos y los recursos usados y solicitados.
      • Usado: la cantidad de almacenamiento efímero local que usan todos los contenedores en todos los espacios de nombres asociados con un alcance. Se calcula a partir de la métrica container/ephemeral_storage/used_bytes.
      • Solicitado: la cantidad de almacenamiento efímero local que solicitan todos los contenedores en todos los espacios de nombres asociados con un alcance. Se calcula a partir de la métrica container/ephemeral_storage/request_bytes.
      • Límite: la cantidad máxima de almacenamiento efímero local disponible para todos los contenedores en todos los espacios de nombres asociados con un alcance. Se calcula a partir de la métrica container/ephemeral_storage/limit_bytes.
  • Uso principal de disco por clúster: lista de clústeres ordenada por un promedio de todos los puntos en el tiempo para un período determinado en el que un momento determinado es una proporción entre los recursos asignables y usados para un particular clúster.
  • Uso principal del disco por espacio de nombres: lista de espacios de nombres ordenada por un promedio de todos los puntos en el tiempo para un período determinado en el que un momento determinado es una proporción entre los recursos usados y solicitados para un particular espacio de nombres.

Distribución de errores por espacio de nombres (solo a nivel del equipo)

Lista de espacios de nombres ordenada por la mayor cantidad de registros de errores para un período determinado. Los registros se recopilan de Cloud Logging.

Distribución del recuento de reinicios por espacio de nombres (solo a nivel del equipo)

Lista de espacios de nombres ordenada por la mayor cantidad de reinicios de contenedores para un período determinado. Se calcula a partir de la métrica container/restart_count.

Soluciona problemas

Las métricas no se cargan para los clústeres nuevos

Si creaste clústeres nuevos, según el período que elijas, es posible que veas No Data en todo el panel de Monitoring o es posible que veas métricas. Por ejemplo, si creaste un clúster en la última hora y eliges un período de 1 hora o 6 horas, el panel puede devolver algunas métricas para tus cargas de trabajo. Sin embargo, si eliges un período de 1 día o más, es posible que veas No data en todo el panel.

Esto se debe a que Cloud Monitoring recopila datos en diferentes períodos (intervalos) para diferentes períodos. Para los períodos de 1 hora y 6 horas, los datos se recopilan en períodos de 1 minuto. Por lo tanto, si tu clúster existe durante unos minutos, verás métricas para estos períodos.

Para los períodos de 1 día y 1 semana, Cloud Monitoring recopila datos en períodos de 1 hora. Si tu clúster existe por menos de una hora, es posible que no veas datos de estos períodos.

Si experimentas este error, comprueba el panel una vez que haya transcurrido más tiempo desde la creación del clúster nuevo.