Esta página foi traduzida pela API Cloud Translation.

Veja métricas de otimização relacionadas com custos

Autopilot Padrão

Esta página mostra como ver as métricas de utilização relacionadas com custos dos seus clusters do Google Kubernetes Engine (GKE). Estas métricas descrevem a eficácia com que os seus clusters e cargas de trabalho do GKE estão a usar os recursos do Compute Engine pelos quais paga.

Pode usar estas informações para otimizar a relação custo/desempenho dos seus clusters e cargas de trabalho.

Métricas de otimização de custos

No separador Otimização de custos na Google Cloud consola, pode ver as seguintes métricas para os seus clusters e cargas de trabalho:

Utilização da CPU: apresenta um gráfico de barras que mostra a relação entre as seguintes métricas da CPU:
- Usado: a quantidade de CPU usada por todos os contentores no cluster ou na carga de trabalho. Calculado a partir da métrica container/cpu/core_usage_time.
- Pedida: a quantidade de CPU pedida por todos os contentores no cluster ou na carga de trabalho. Calculado a partir da métrica container/cpu/request_cores.
- Atribuível: a quantidade de CPU atribuída a todos os nós no cluster. Esta métrica é apresentada na página Clusters. Calculado a partir da métrica node/cpu/allocatable_cores. Para clusters do Autopilot, não existe nenhum valor atribuível porque a Google ajusta automaticamente as atribuições de CPU.
- Limite: o limite da CPU para todos os contentores numa carga de trabalho. Esta métrica é apresentada na página Cargas de trabalho. Calculado a partir da métrica container/cpu/limit_cores.
Horas de CPU: o número total de horas de núcleos em todos os nós numa carga de trabalho ou num cluster dentro do período selecionado. Calculado a partir da métrica node/cpu/total_cores (para clusters padrão) e da métrica container/cpu/request_cores (para clusters e cargas de trabalho do Autopilot).
Utilização de memória: apresenta um gráfico de barras que mostra a relação entre as seguintes métricas de memória:
- Usado: a quantidade de memória usada por todos os contentores num cluster ou numa carga de trabalho. Calculado a partir da métrica container/memory/used_bytes.
- Pedida: a quantidade de memória pedida para todos os contentores num cluster ou numa carga de trabalho. Calculado a partir da métrica container/memory/request_bytes.
- Allocatable: a quantidade de memória alocada a todos os nós no cluster. Esta métrica é apresentada na página Clusters. Calculado a partir da métrica node/memory/allocatable_bytes. Para clusters do Autopilot, não existe um valor atribuível porque a Google ajusta automaticamente as atribuições de memória.
- Limite: o limite de memória para todos os contentores numa carga de trabalho. Esta métrica é apresentada na página Cargas de trabalho. Calculado a partir da métrica container/memory/limit_bytes.
Horas de memória: a quantidade total de memória em todos os nós numa carga de trabalho ou num cluster no período selecionado. Calculado a partir da métrica node/memory/total_bytes (para clusters) e da métrica container/memory/requested_bytes (para clusters e cargas de trabalho do Autopilot).

Veja as métricas

Para ver as métricas de utilização relacionadas com custos, siga estes passos na Google Cloud consola :

Para ver métricas ao nível do cluster, aceda à página Clusters do Kubernetes.

Aceda a Clusters do Kubernetes

Para ver métricas ao nível da carga de trabalho, aceda à página Cargas de trabalho.

Aceda a Cargas de trabalho
Selecione o separador Otimização de custos.
Escolha o período durante o qual as métricas são calculadas em média (utilização) ou acumuladas (total de horas). Por exemplo, 1 dia, 1 mês e muito mais. Se a duração do cluster ou da carga de trabalho for inferior ao período selecionado, são apresentadas as métricas acumuladas durante a duração do cluster ou da carga de trabalho. Por exemplo, escolhe um período de 1 dia, mas a carga de trabalho foi criada há apenas 4 horas, pelo que só são apresentadas 4 horas de métricas.
Mantenha o ponteiro sobre a métrica de utilização para ver mais detalhes.

As métricas de otimização de custos são apresentadas para os modos de cluster da seguinte forma:

Os clusters padrão têm sempre métricas usadas, pedidas e atribuíveis visíveis no momento da criação devido à inclusão de componentes do GKE geridos no cálculo geral (namespace kube-system).

Os clusters do Autopilot só apresentam métricas quando implementa cargas de trabalho com pedidos especificados para o cluster. Isto deve-se ao modelo de preços do Autopilot. Os clusters do Autopilot não mostram métricas atribuíveis porque só paga pelos recursos pedidos pelas suas cargas de trabalho em execução.

As cargas de trabalho implementadas em clusters padrão que não tenham pedidos ou limites especificados não mostram uma proporção no gráfico. Em alternativa, o gráfico de barras representa apenas a métrica de utilização da carga de trabalho.

As cargas de trabalho implementadas em clusters do Autopilot que não tenham pedidos ou limites especificados, vão ter valores predefinidos aplicados aos contentores e vão apresentar as proporções em todos os momentos.

O que se segue?

Saiba mais sobre as práticas recomendadas para executar aplicações otimizadas em termos de custos no GKE.
Leia a publicação no blogue Crie um cluster otimizado em função dos custos com apenas alguns cliques.
Saiba como ver métricas de observabilidade.