Métricas de utilização de recursos da frota

Esta página explica mais detalhadamente as métricas de utilização de recursos da frota e da equipa, explicando como estas métricas são calculadas e dando sugestões sobre como usar estas métricas para otimizar a utilização de recursos.

Pode ver estas métricas nos seguintes painéis de controlo:

Estas métricas descrevem a eficácia com que os seus clusters estão a usar os recursos disponíveis fisicamente pelos quais paga ou os recursos que atribui no hardware no local. Pode usar estas informações para compreender a eficácia da utilização dos recursos em grande escala, ao nível de uma frota ou de uma equipa. Isto pode ajudar a otimizar o tamanho do cluster e a atribuição de recursos em clusters e namespaces, ou otimizar a forma como as equipas de aplicações pedem e reservam recursos.

Use métricas de utilização de recursos

As seguintes dicas podem ajudar a usar as métricas na consola para identificar e resolver problemas:

  • Se a Utilização total da CPU/memória/disco da sua frota indicar uma utilização inesperadamente alta ou baixa nos últimos sete dias, verifique sempre o gráfico correspondente Utilização da CPU/memória/disco por frota para avaliar se a utilização inesperada é constante ou causada por picos de utilização.
  • Se a opção Utilização máxima da CPU/memória/disco por cluster indicar clusters individuais que se comportam de forma diferente dos restantes, considere investigar esses clusters específicos mais detalhadamente. Considere redimensionar os clusters, se possível.
  • Se Utilização máxima da CPU/memória/disco por espaço de nomes mostrar um aumento inesperado nos últimos sete dias, considere investigar se uma carga de trabalho específica está a causar o aumento. Uma possível solução pode ser redistribuir as cargas de trabalho pelos recursos.
  • A utilização da CPU/memória/disco por frota permite-lhe observar a proporção entre os recursos usados e os recursos pedidos. Uma grande diferença entre os dois pode significar que as equipas de aplicações estão a pedir e a reservar demasiados recursos.

Compreenda as métricas de utilização de recursos

As seguintes métricas são fornecidas nos painéis de controlo de vista geral do GKE, da frota e da equipa, calculadas com base em informações do Cloud Monitoring nos clusters da sua frota.

Pode ver métricas ao nível da frota nos painéis de controlo de vista geral do GKE e da frota. As métricas ao nível da equipa estão disponíveis nos painéis de controlo de vista geral da equipa e do GKE.

Métricas da CPU

  • Utilização total da CPU:
    • Para as métricas ao nível da frota, uma média de todos os pontos no tempo para um determinado período, em que o ponto no tempo é uma relação entre os recursos atribuíveis e usados em todos os clusters registados numa frota.
      • Atribuível: a quantidade de CPU atribuída a todos os nós em todos os clusters registados numa frota. Calculado a partir da métrica node/cpu/allocatable_cores.
      • Usado: a quantidade de CPU usada por todos os contentores em todos os clusters registados numa frota. Calculado a partir da métrica container/cpu/core_usage_time.
    • Para o painel de controlo Monitoring, uma média de todos os pontos no tempo para um determinado período, em que o ponto no tempo é uma proporção entre os recursos pedidos e usados em todos os espaços de nomes associados a um âmbito de equipa.
      • Pedido: a quantidade de CPU pedida por todos os contentores em todos os espaços de nomes associados a um âmbito de equipa. Calculado a partir da métrica container/cpu/request_cores.
      • Usado: a quantidade de CPU usada por todos os contentores em todos os namespaces associados a um âmbito de equipa. Calculada a partir da métrica container/cpu/core_usage_time.
  • Utilização da CPU por frota/equipa:
    • Ao nível da frota, a relação entre os recursos usados, pedidos e atribuídos.
      • Usado: a quantidade de CPU usada por todos os contentores em todos os clusters registados numa frota. Calculado a partir da métrica container/cpu/core_usage_time.
      • Pedida: a quantidade de CPU pedida por todos os contentores em todos os clusters registados numa frota. Calculada a partir da métrica container/cpu/request_cores.
      • Atribuível: a quantidade de CPU atribuída a todos os nós em todos os clusters registados numa frota. Calculado a partir da métrica node/cpu/allocatable_cores.
    • Para o nível da equipa, a relação entre o limite de recursos e os recursos usados e pedidos.
      • Usado: a quantidade de CPU usada por todos os contentores em todos os namespaces associados a um âmbito de equipa. Calculada a partir da métrica container/cpu/core_usage_time.
      • Pedido: a quantidade de CPU pedida por todos os contentores em todos os espaços de nomes associados a um âmbito de equipa. Calculado a partir da métrica container/cpu/request_cores.
      • Limite: a quantidade máxima de CPU disponível para todos os contentores em todos os espaços de nomes associados a um âmbito de equipa. Calculado a partir da métrica container/cpu/limit_cores.
  • Utilização máxima da CPU por cluster: lista de clusters ordenada por uma média de todos os pontos no tempo para um determinado período, em que o ponto no tempo é uma proporção entre os recursos atribuíveis e usados para um cluster específico.
  • Utilização da CPU principal por espaço de nomes: lista de espaços de nomes ordenada por uma média de todos os pontos no tempo para um determinado intervalo de tempo em que o ponto no tempo é uma proporção entre os recursos usados e pedidos para um espaço de nomes específico.
    • Usado: a quantidade de CPU usada por todos os contentores num espaço de nomes. Calculado a partir da métrica container/cpu/core_usage_time.
    • Pedida: a quantidade de CPU pedida por todos os contentores num espaço de nomes. Calculado a partir da métrica container/cpu/request_cores.

Métricas de memória

  • Utilização total de memória:
    • Para as métricas ao nível da frota, isto refere-se a uma média de todos os pontos no tempo para um determinado período, em que o ponto no tempo é uma proporção entre os recursos atribuíveis e usados em todos os clusters pertencentes a uma frota.
      • Atribuível: a quantidade de memória atribuída a todos os nós em todos os clusters registados numa frota. Calculada a partir da métrica node/memory/allocatable_byte.
      • Usado: a quantidade de memória não removível usada por todos os contentores em todos os clusters registados numa frota. Calculado a partir da métrica container/memory/used_bytes.
    • Para as métricas ao nível da equipa, isto refere-se a uma média de todos os pontos no tempo para um determinado intervalo de tempo em que o ponto no tempo é uma proporção entre os recursos pedidos e usados em todos os espaços de nomes que pertencem a um âmbito da equipa.
      • Pedida: a quantidade de memória pedida por todos os contentores em todos os espaços de nomes associados a um âmbito. Calculado a partir da métrica container/memory/request_bytes.
      • Usado: a quantidade de memória não removível usada por todos os contentores em todos os espaços de nomes associados a um âmbito. Calculado a partir da métrica container/memory/used_bytes.
  • Utilização da memória por frota/equipa:
    • Ao nível da frota, a relação entre os recursos usados, pedidos e atribuídos.
      • Usado: a quantidade de memória não removível usada por todos os contentores em todos os clusters registados numa frota. Calculado a partir da métrica container/memory/used_bytes.
      • Pedida: a quantidade de memória pedida por todos os contentores em todos os clusters registados numa frota. Calculada a partir da métrica container/memory/request_bytes.
      • Atribuível: a quantidade de memória atribuída a todos os nós em todos os clusters registados numa frota. Calculada a partir da métrica node/memory/allocatable_byte.
    • Para o nível da equipa, a relação entre o limite de recursos e os recursos usados e pedidos.
      • Usado: a quantidade de memória não removível usada por todos os contentores em todos os espaços de nomes associados a um âmbito. Calculado a partir da métrica container/memory/used_bytes.
      • Pedida: a quantidade de memória pedida por todos os contentores em todos os espaços de nomes associados a um âmbito. Calculado a partir da métrica container/memory/request_bytes.
      • Limite: a quantidade máxima de memória disponível para todos os contentores em todos os espaços de nomes associados a um âmbito. Calculado a partir da métrica container/memory/limit_bytes.
  • Utilização de memória principal por cluster: lista de clusters ordenada pela média de todos os pontos no tempo para um determinado período, em que o ponto no tempo é uma proporção entre os recursos atribuíveis e usados para um cluster específico.
    • Atribuível: a quantidade de memória atribuída a todos os nós num cluster. Calculado a partir da métrica node/memory/allocatable_byte.
    • Usado: a quantidade de memória não removível usada por todos os contentores num cluster. Calculado a partir da métrica container/memory/used_bytes.
  • Utilização de memória superior por espaço de nomes: lista de espaços de nomes ordenada por uma média de todos os pontos no tempo para um determinado intervalo de tempo em que o ponto no tempo é uma proporção entre os recursos usados e pedidos para um espaço de nomes específico.
    • Usado: a quantidade de memória não removível usada por todos os contentores num espaço de nomes. Calculado a partir da métrica container/memory/used_bytes.
    • Pedida: a quantidade de memória pedida por todos os contentores num espaço de nomes. Calculado a partir da métrica container/memory/request_bytes.

Métricas de disco

  • Utilização total do disco:
    • Para as métricas ao nível da frota, isto refere-se a uma média de todos os pontos no tempo para um determinado período, em que o ponto no tempo é uma proporção entre os recursos atribuíveis e usados em todos os clusters pertencentes a uma frota.
      • Atribuível: a quantidade de armazenamento efémero local atribuído a todos os nós em todos os clusters registados numa frota. Calculado a partir da métrica node/ephemeral_storage/allocatable_bytes.
      • Usado: a quantidade de armazenamento efémero local usado por todos os contentores em todos os clusters registados numa frota. Calculado a partir da métrica container/ephemeral_storage/used_bytes.
    • Para as métricas ao nível da equipa, isto refere-se a uma média de todos os pontos no tempo para um determinado intervalo de tempo em que o ponto no tempo é uma proporção entre os recursos pedidos e usados em todos os espaços de nomes que pertencem a um âmbito da equipa.
      • Pedida: a quantidade de armazenamento efémero local pedida por todos os contentores em todos os espaços de nomes associados a um âmbito. Calculado a partir da métrica container/ephemeral_storage/request_bytes.
      • Usado: a quantidade de armazenamento efémero local usado por todos os contentores em todos os espaços de nomes associados a um âmbito. Calculado a partir da métrica container/ephemeral_storage/used_bytes.
  • Utilização do disco por frota/equipa:
    • Ao nível da frota, a relação entre os recursos usados, pedidos e atribuídos.
      • Usado: a quantidade de armazenamento efémero local usado por todos os contentores em todos os clusters registados numa frota. Calculado a partir da métrica container/ephemeral_storage/used_bytes.
      • Pedida: a quantidade de armazenamento efémero local pedida por todos os contentores em todos os clusters registados numa frota. Calculado a partir da métrica container/ephemeral_storage/request_bytes.
      • Atribuível: a quantidade de armazenamento efémero local atribuído a todos os nós em todos os clusters registados numa frota. Calculado a partir da métrica node/ephemeral_storage/allocatable_bytes.
    • Para o nível da equipa, a relação entre o limite de recursos e os recursos usados e pedidos.
      • Usado: a quantidade de armazenamento efémero local usado por todos os contentores em todos os espaços de nomes associados a um âmbito. Calculado a partir da métrica container/ephemeral_storage/used_bytes.
      • Pedida: a quantidade de armazenamento efémero local pedida por todos os contentores em todos os espaços de nomes associados a um âmbito. Calculado a partir da métrica container/ephemeral_storage/request_bytes.
      • Limite: a quantidade máxima de armazenamento efémero local disponível para todos os contentores em todos os espaços de nomes associados a um âmbito. Calculado a partir da métrica container/ephemeral_storage/limit_bytes.
  • Utilização máxima do disco por cluster: lista de clusters ordenada pela média de todos os pontos no tempo para um determinado período, em que o ponto no tempo é uma proporção entre os recursos atribuíveis e usados para um cluster específico.
  • Utilização máxima do disco por espaço de nomes: lista de espaços de nomes ordenada por uma média de todos os pontos no tempo para um determinado intervalo de tempo em que o ponto no tempo é uma proporção entre os recursos usados e pedidos para um espaço de nomes específico.

Distribuição de erros por espaço de nomes (apenas ao nível da equipa)

Lista de espaços de nomes ordenada pelo número mais elevado de registos de erros para um determinado período. Os registos são recolhidos do Cloud Logging.

Reinicie a distribuição de contagens por espaço de nomes (apenas ao nível da equipa)

Lista de espaços de nomes ordenada pelo número mais elevado de reinícios de contentores para um determinado período. Calculado a partir da métrica container/restart_count.

Resolução de problemas

As métricas não são carregadas para novos clusters

Se tiver criado novos clusters, consoante o período selecionado, pode ver No Data no painel de controlo Monitorização ou pode ver métricas. Por exemplo, se criou um cluster na última hora e selecionar um período de 1 hora ou 6 horas, o painel de controlo pode devolver algumas métricas para as suas cargas de trabalho. No entanto, se selecionar um período de 1 dia ou mais, pode ver No data apresentado no painel de controlo.

Isto deve-se ao facto de o Cloud Monitoring recolher dados em diferentes períodos (intervalos) para diferentes janelas de tempo. Para intervalos de tempo de 1 hora e 6 horas, os dados são recolhidos em períodos de 1 minuto. Assim, se o cluster existir há alguns minutos, vê métricas para estes intervalos de tempo.

Para intervalos de tempo de 1 dia e 1 semana, o Cloud Monitoring recolhe dados em períodos de 1 hora. Se o cluster existir há menos de uma hora, é possível que não veja dados para estes intervalos de tempo.

Se receber este erro, verifique o painel de controlo após mais tempo desde a criação do novo cluster.