Nesta página, mostramos como visualizar as métricas de integridade da infraestrutura dos clusters e cargas de trabalho do Google Kubernetes Engine (GKE). Essas métricas podem ajudar a resolver problemas nos clusters e cargas de trabalho do GKE.
Requisitos
- As métricas do sistema precisam estar ativadas nos clusters para usar as métricas de visão geral na guia Observabilidade. As métricas do sistema estão sempre ativadas nos clusters do Autopilot e são ativadas por padrão nos clusters do Standard.
- As métricas do plano de controle precisam estar ativadas nos clusters para que elas sejam usadas na guia Observabilidade. Se você selecionar Plano de controle na guia Observabilidade do cluster e as métricas não estiverem ativadas, você verá uma notificação de que as métricas não estão ativadas. Para ativá-las, clique em Ativar pacote. Para informações sobre outras maneiras de ativar as métricas do plano de controle, consulte Como configurar a coleta de métricas do plano de controle.
Métricas de observabilidade
Na guia Observabilidade no console do Google Cloud, é possível acessar métricas de desempenho para clusters e cargas de trabalho.
No Google Kubernetes Engine (GKE) Enterprise, os gráficos mostram todos os clusters em uma frota.
Métricas para clusters e cargas de trabalho
As métricas a seguir estão disponíveis para clusters e cargas de trabalho:
- Visão geral: mostra métricas resumidas da integridade da infraestrutura, como utilização de solicitações de CPU e memória, logs de erros e eventos de alerta.
- CPU: mostra o uso da CPU e da solicitação principal.
- Memória: mostra a utilização da solicitação de memória.
As seguintes métricas estão disponíveis para clusters:
- Eventos do Kubernetes: oferece visibilidade das contagens de eventos ao longo do tempo e um registro detalhado de eventos.
- Plano de controle: oferece visibilidade da integridade dos componentes do plano de controle do Kubernetes, como o kube-apiserver e o programador. Também oferece informações como o número de pods não programáveis. Os pods no estado não programável foram testados para serem programados e foram determinados como não programáveis. Os pods nesse estado são um sinal de que nada no cluster mudou que os tornaria programáveis.
- Ingestão de operações do Cloud: oferece visibilidade sobre a quantidade de geração de registros e ingestão de métricas correlacionada ao custo. Para mais informações, consulte os preços do pacote de operações do Google Cloud.
- Armazenamento temporário: disponível na guia Observabilidade de um cluster escolhido: permite ver o armazenamento temporário usado por um cluster para determinar se o armazenamento do cluster está sendo usado de maneira eficiente. Na página Observabilidade da guia Visão geral, um gráfico mostra o armazenamento temporário usado pelo cluster e o Armazenamento temporário mostra métricas adicionais, incluindo capacidade, taxa de operações de E/S e outras. Algumas dessas métricas não estão disponíveis para clusters do Autopilot.
- Persistent: fornece visibilidade em PersistentVolumes e Claims.
- Estado das cargas de trabalho: fornece visibilidade sobre os seguintes tipos de recursos: pod, implantação, StatefulSet, DaemonSet e Autoescalador de pods horizontal.
Interpretar métricas de observabilidade
As métricas podem ajudar você a resolver problemas com seus clusters do GKE, como:
- Altas tendências de utilização de solicitação de memória ou CPU podem indicar que você precisa configurar contêineres em um cluster ou namespace para usar menos recursos.
- Um número alto de reinicializações de contêineres pode indicar que eles estão com falhas.
- Um grande número de pods não programáveis indica recursos ou erros de configuração insuficientes.
- A alta ingestão do Cloud Logging ou do Google Cloud Managed Service para Prometheus corresponde ao custo do pacote de operações do Google Cloud. Você pode economizar custos reduzindo a ingestão. Para mais informações sobre o Google Cloud Managed Service para Prometheus, consulte Atribuição e controles de custos. Para mais informações sobre a geração de registros, consulte Filtros de exclusão.
Consultar as métricas de observabilidade de clusters e cargas de trabalho
Para visualizar métricas de observabilidade dos clusters ou cargas de trabalho, execute as seguintes etapas no console do Google Cloud:
Acesse a página Clusters do Kubernetes ou cargas de trabalho do Kubernetes:
Selecione a guia Observabilidade.
Escolha o período em que as métricas são agregadas. Arraste o gráfico dentro de um período específico. Clique em Redefinir zoom para voltar ao intervalo selecionado anteriormente.
Para visualizar métricas de observabilidade de um cluster ou carga de trabalho selecionado, execute as seguintes etapas no console do Google Cloud:
Acesse a página Clusters do Kubernetes ou cargas de trabalho do Kubernetes:
Clique no nome de um cluster ou de uma carga de trabalho.
Selecione a guia Observabilidade.
Escolha o período em que as métricas são agregadas. Arraste o gráfico dentro de um período específico. Clique em Redefinir zoom para voltar ao intervalo selecionado anteriormente.
Criar um painel personalizado com base em uma vista selecionada
Para adicionar os gráficos visíveis a um painel personalizável no Cloud Monitoring, siga estas etapas no console do Google Cloud:
Acesse a página Clusters do Kubernetes ou cargas de trabalho do Kubernetes:
Selecione a guia Observabilidade.
Também é possível selecionar filtros para os dados.
Clique em Salvar como painel personalizado.
Especifique um nome para o novo painel.
Clique em Enviar para criar um novo painel.
Clique em Ver no Monitoring para ver o painel.
Acessar os painéis do GKE no Cloud Monitoring
O Monitoring fornece painéis adicionais para o GKE e outros serviços do Google Cloud. Use os painéis fornecidos ou faça uma cópia para que você possa personalizá-lo de acordo com suas necessidades.
A lista de painéis também inclui manuais do GKE que podem ser usados para solucionar problemas comuns.
-
No console do Google Cloud, selecione Monitoramento e Painéis ou clique no botão a seguir:
Na lista "Categorias", selecione G C P.
Selecione o painel ou manual que você quer acessar.
- No painel GKE, você encontra informações gerais de clusters, cargas de trabalho, serviços e outros recursos que você pode filtrar. Clique em um recurso para conferir detalhes da métrica e do registro. Para namespaces, cargas de trabalho e serviços do Kubernetes, também é possível exibir e criar objetivos de nível de serviço (SLOs) na visualização de detalhes.
- Outros painéis e manuais do GKE se concentram em recursos ou condições específicos, como cargas de trabalho em risco.