Nesta página, mostramos como ver as métricas de utilização relacionadas ao custo dos clusters do Google Kubernetes Engine (GKE). Essas métricas descrevem a eficiência dos clusters e das cargas de trabalho do GKE ao usar os recursos do Compute Engine pagos.
É possível usar essas informações para otimizar a proporção de custo por desempenho dos clusters e cargas de trabalho.
Métricas de otimização de custos
Na guia Otimização de custos do console do Google Cloud, é possível visualizar as seguintes métricas de clusters e cargas de trabalho:
- Uso da CPU: exibe um gráfico de barras que mostra a relação
entre as seguintes métricas de CPU:
- Usada: a quantidade de CPU usada por todos os contêineres no cluster ou na carga de trabalho. Calculado com base na métrica
container/cpu/core_usage_time
. - Solicitadas: a quantidade de CPU solicitada por todos os contêineres no
cluster ou na carga de trabalho. Calculado com base na métrica
container/cpu/request_cores
. - Alocável: a quantidade de CPU alocada para todos os nós no cluster.
Essa métrica é exibida na página "Clusters". Calculado com base na métrica
node/cpu/allocatable_cores
. Para clusters do Autopilot, não há valor alocável porque o Google ajusta automaticamente as alocações de CPU. - Limite: o limite da CPU em todos os contêineres de uma carga de trabalho. Essa métrica é mostrada na página "Cargas de trabalho". Calculado com base na métrica
container/cpu/limit_cores
.
- Usada: a quantidade de CPU usada por todos os contêineres no cluster ou na carga de trabalho. Calculado com base na métrica
- Horas de CPU: o número total de horas de núcleo em todos os nós em uma carga de trabalho ou um cluster no período selecionado. Calculado com base na métrica
node/cpu/total_cores
(para clusters padrão) e na métricacontainer/cpu/request_cores
(para clusters do Autopilot). e cargas de trabalho).
- Uso de memória: exibe um gráfico de barras que mostra a relação entre as seguintes métricas de memória:
- Usada: a quantidade de memória usada por todos os contêineres em um cluster ou carga de trabalho. Calculado com base na métrica
container/memory/used_bytes
. - Solicitadas: a quantidade de memória solicitada para todos os contêineres em um
cluster ou carga de trabalho. Calculado com base na métrica
container/memory/request_bytes
. - Alocável: a quantidade de alocação de memória para todos os nós no cluster. Essa métrica é exibida na página "Clusters". Calculado com base na métrica
node/memory/allocatable_bytes
. Para clusters do Autopilot, não há valor alocável porque o Google ajusta automaticamente as alocações de memória. - Limite: o limite de memória para todos os contêineres em uma carga de trabalho. Essa
métrica é mostrada na página "Cargas de trabalho". Calculado com base na métrica
container/memory/limit_bytes
.
- Usada: a quantidade de memória usada por todos os contêineres em um cluster ou carga de trabalho. Calculado com base na métrica
- Horas de memória: a quantidade total de memória em todos os nós de uma carga de trabalho ou
um cluster no período selecionado. Calculado com base na métrica
node/memory/total_bytes
(para clusters) e na métricacontainer/memory/requested_bytes
(para clusters e cargas de trabalho do Autopilot).
Ver as métricas
Para visualizar métricas de utilização relacionadas ao custo, execute as seguintes etapas no console do Google Cloud:
Para ver as métricas no nível do cluster, acesse a página Clusters do Kubernetes.
Acessar os clusters do Kubernetes
Para ver as métricas no nível da carga de trabalho, acesse a página Cargas de trabalho.
Selecione a guia Otimização de custos.
Escolha o período em que as métricas são calculadas (utilização) ou acumuladas (total de horas). Por exemplo, 1 dia, 1 mês e muito mais. Se o ciclo de vida do cluster ou da carga de trabalho for menor que o período selecionado, as métricas serão acumuladas durante a vida útil do cluster ou da carga de trabalho. Por exemplo, você escolhe um período de um dia, mas a carga de trabalho foi criada há apenas quatro horas. Portanto, apenas quatro horas de métricas são exibidas.
Passe o cursor sobre a métrica de utilização para ver mais detalhes.
As métricas de otimização de custos serão exibidas para os modos de cluster da seguinte maneira:
- Os clusters padrão sempre terão métricas usadas, solicitadas e alocáveis visíveis no momento da criação devido à inclusão de componentes gerenciados do GKE no cálculo geral (namespace kube-system).
- Os clusters do Autopilot só exibem métricas quando você implanta cargas de trabalho com solicitações especificadas no cluster. Isso ocorre devido ao modelo de preços do Autopilot. Os clusters do Autopilot não mostram métricas alocáveis porque você paga apenas pelos recursos solicitados pelas cargas de trabalho em execução.
As cargas de trabalho implantadas nos clusters padrão que não têm solicitações ou limites especificados não vão mostrar uma proporção no gráfico. Em vez disso, o gráfico de barras representará apenas a métrica de uso da carga de trabalho.
As cargas de trabalho implantadas nos clusters do Autopilot que não têm solicitações ou limites especificados terão os valores padrão aplicados aos contêineres e sempre mostrarão as proporções.
A seguir
- Saiba mais sobre as Práticas recomendadas para executar aplicativos otimizados para custos no GKE.
- Leia a postagem do blog Criar um cluster com custo otimizado em apenas alguns cliques.
- Saiba como ver as métricas de observabilidade.