Usar a visão geral do GKE Enterprise

O painel de visão geral do GKE Enterprise no console do Google Cloud fornece um panorama geral da sua frota. A visão geral ajuda você a usar seus recursos do GKE Enterprise mostrando quantas preocupações de segurança sua frota tem, cobertura do Policy Controller em toda a frota e status da sincronização dos pacotes do Config Sync. Além disso, o painel fornece uma visualização no nível da frota da utilização de recursos das suas frotas, clusters e equipes. Use essas informações para otimizar os gastos, o design do aplicativo e a alocação de recursos, incluindo a utilização de CPU, memória e disco.

Antes de ler este documento, confira se você conhece o gerenciamento de recursos do Kubernetes, conforme descrito na documentação Gerenciamento de recursos para pods e contêineres do Kubernetes.

A visão geral do GKE Enterprise no console do Google Cloud está disponível apenas para usuários da frota que ativaram o GKE Enterprise.

Consulte a visão geral

Para acessar o painel de visão geral:

Com o projeto host da frota selecionado, acesse a visão geral do GKE Enterprise no console do Google Cloud.

Acesse a visão geral do GKE Enterprise

Selecionar um filtro de período

Por padrão, a visão geral do GKE Enterprise mostra a utilização de recursos na última hora. Para mudar esse período, use a opção de filtro:

Selecione o período de utilização média de recursos dos contêineres da frota. Escolha uma das opções predefinidas ou selecione Personalizado para especificar um período personalizado.

Ver clusters, escopos de equipe, custo e o uso total de recursos

A primeira seção fornece uma visão geral dos seus clusters, escopos de equipe, custo estimado da sua frota e a utilização total de CPU/memória/disco durante o período escolhido. As métricas de utilização dos recursos são geradas com dados do sistema do Cloud Monitoring dos clusters da sua frota.

Se você receber a notificação Dados ausentes de..., consulte a seção Ativar o Cloud Monitoring do sistema para clusters de frotas para resolver o problema.

Ver status do cluster

Na seção Clusters nesta frota, é possível ver quantos clusters há na sua frota. Se houver algum problema com a conectividade do cluster com a frota, você verá avisos ou erros. Por exemplo, se você excluiu um cluster sem cancelar o registro dele ou se precisa fazer login primeiro a um cluster fora do Google Cloud para ver os detalhes dele.

Se um erro ou aviso for exibido, clique na notificação para ver os clusters do problema e corrigi-los.
Clique em Ver todos os clusters para acessar a lista completa de clusters da sua frota.

Ver escopos da equipe

Na seção Escopos da equipe, é possível ver o número de escopos de equipe nessa frota. Com os escopos de equipe, é possível definir subconjuntos de recursos da frota por equipe. Depois de definir esses escopos, use os recursos de gerenciamento de equipes para que cada equipe possa atuar como um "locatário" separado na frota.

Clique em Ver todos os escopos de equipe para consultar a lista completa de escopos de equipe na sua frota.

Conferir o custo mensal estimado

Na seção Custo mensal estimado, você pode ver o custo mensal estimado de todos os recursos da sua frota.

Clique em Ver na otimização de custos para métricas de utilização relacionadas ao custo mais detalhadas da sua frota.

Ver a utilização total de recursos

A seção Uso total mostra o uso médio de todos os recursos reais de CPU, memória e disco dos contêineres da frota em relação aos recursos alocáveis em nós de clusters nesta frota. Os dados são exibidos para o período que você escolheu. Alocável em um nó do Kubernetes é definido como a quantidade de recursos que podem ser usados por pods regulares nesse nó.

Essa visualização oferece uma visão geral rápida do uso de recursos da sua frota e dos recursos disponíveis, e pode indicar possíveis problemas para investigar mais com métricas mais detalhadas: por exemplo, se a utilização total de CPU é muito baixa, você pode usar as métricas "por cluster" abaixo para identificar os clusters que podem ser redimensionados.

Acessar gerenciamento de atributos

Conferir preocupações de segurança

Para ajudar a identificar problemas de segurança que afetam os clusters de membro da frota, como vulnerabilidades ativas ou problemas de configuração da carga de trabalho, consulte a seção Preocupações de segurança. Esta seção mostra as seguintes informações:

O número total de problemas encontrados na sua frota. As preocupações são agrupadas por gravidade, e a gravidade é atribuída com base na Escala de classificação de gravidade qualitativa do CVSS (em inglês).
Uma análise dos problemas por tipo. Isso ajuda a identificar se os problemas são causados por problemas de configuração, um boletim de segurança ou uma vulnerabilidade.

Para ter uma visão geral da segurança do GKE e ver orientações úteis sobre como resolver problemas descobertos, clique em Visualizar postura de segurança. Se você nunca usou o painel de postura de segurança, clique em Ativar postura de segurança para ativar a API Container Security e acessar esse painel.

Saiba mais em Sobre o painel de postura de segurança.

Ver a cobertura do Policy Controller

O Policy Controller permite a aplicação de políticas totalmente programáveis nos clusters. Essas políticas funcionam como "proteções" e impedem que qualquer alteração na configuração da API Kubernetes viole os controles operacionais, de segurança ou de conformidade da sua organização.

A seção Status da política mostra quantos clusters têm o Policy Controller ativado.

Clique em Ver política para acessar o painel do Policy Controller. Se você não instalou o Policy Controller em um cluster, clique em Ativar política.

Saiba mais sobre o Policy Controller na documentação.

Conferir a integridade do pacote Config Sync

O Config Sync é um serviço do GitOps que permite que os operadores de cluster e os administradores da plataforma implantem pacotes de uma fonte de verdade. Um pacote contém todas as configurações contidas em cada origem de sincronização do cluster. A origem pode ser um repositório Git, um diretório em um repositório Git, uma imagem OCI ou um repositório Helm. Como é possível sincronizar seu cluster de várias origens, é possível ter vários pacotes por cluster.

A seção Config status mostra as seguintes informações:

O número total de pacotes na sua frota
O status da sincronização dos pacotes na sua frota

Clique em Ver visão geral da configuração para conferir o painel do Config Sync. Se você não instalou o Config Sync em um cluster, clique em Ativar o Config Sync.

Saiba mais sobre o Config Sync na documentação dele.

Conferir a eficiência da frota

Nesta seção, apresentamos uma visão detalhada de como sua frota está usando os recursos locais ou na nuvem, incluindo a utilização de recursos por frota e a utilização principal e baixa de recursos por cluster. Isso ajuda a identificar, por exemplo, onde há clusters subutilizados ou potencialmente utilizados, que convém redimensionar. Leia sobre como essas métricas são calculadas em mais detalhes em Métricas de utilização de recursos da frota.

Ver utilização de recursos ao longo do tempo

Com a linha Uso de CPU/memória/disco por frota, é possível ver mais detalhes sobre como sua frota usa recursos ao longo do tempo. Ele também mostra os recursos solicitados dos clusters, os recursos alocáveis e o uso real. Cada painel mostra um gráfico do uso agregado de CPU, memória ou disco ao longo do período escolhido, com as seguintes informações exibidas como linhas separadas:

Alocável: a quantidade de recursos alocáveis nos nós do cluster da frota.
Solicitado: a quantidade de recursos que os contêineres em sua frota solicitaram
Usado: a quantidade real do recurso que seus contêineres usaram.

Para ver detalhes de um ponto específico no gráfico, role o gráfico até o ponto em que você tem interesse (por exemplo, um pico visível no uso real no gráfico). As informações de uso de recursos alocáveis, solicitados e reais para esse período serão exibidas.

Para alternar a exibição de uma ou mais linhas no gráfico, clique nas métricas relevantes abaixo do gráfico.

Ver os principais usos de recursos por cluster

A última linha de utilização dos recursos mostra a Melhor utilização de CPU/memória/disco por cluster, permitindo que você veja rapidamente quais clusters específicos são os maiores usuários dos recursos alocáveis. Cada painel lista os principais clusters em ordem de utilização (mais alto primeiro). Para cada cluster, é possível ver um gráfico do uso do recurso e uma média do uso em relação aos recursos alocáveis durante o período escolhido. Essa visualização pode ajudar você a, por exemplo, ver clusters muito usados. Os clusters que não têm recursos suficientes disponíveis podem não conseguir programar pods.

Clique no nome do cluster de seu interesse para ver mais detalhes sobre como ele está usando os recursos. Na visualização de utilização, também é possível ver quantas reinicializações de contêiner e registros de erro seu cluster tem.

Clique em Ver todos os clusters por utilização de CPU/memória/disco para consultar uma lista classificada de todos os clusters na sua frota.

Ver a baixa utilização de recursos por cluster

A linha final de utilização de recursos mostra a baixa utilização de CPU/memória/disco por cluster da frota para que você veja rapidamente quais clusters estão sendo subutilizados. Os cinco clusters que usam menos recursos aparecem na parte de cima de cada painel, com um gráfico de uso e uma média do uso de recursos em relação aos recursos alocáveis durante o período escolhido.

Clique em Ver todos os clusters por utilização de CPU/memória/disco para consultar uma lista classificada de todos os clusters na sua frota.

Mostrar a eficiência da equipe

Esta seção fornece uma visão geral de como suas equipes estão usando os recursos na nuvem ou no local. Ele também ajuda a monitorar quais equipes estão encontrando problemas.

Clique na equipe do seu interesse para ver mais detalhes no painel da equipe. No painel da equipe, veja mais detalhes sobre a utilização de recursos e os namespaces da equipe. Isso pode ajudar você a ver quais namespaces estão afetando o uso de recursos da equipe.

Ver os principais usos de recursos por escopo da equipe

Com o uso de CPU/memória/disco por escopo, é possível ver rapidamente quais equipes específicas são as maiores usuárias de recursos. Cada painel lista os principais clusters em ordem de utilização (mais alto primeiro). Para cada equipe, é possível ver um gráfico do uso do recurso e uma média do uso em relação à solicitação.

Para conferir a utilização de recursos de todas as equipes no período escolhido, clique em Ver todas as equipes por utilização de CPU/memória/disco.

Ver a distribuição de erros por escopo

Esse card indica as equipes com mais registros de erros para a janela de tempo escolhida.

Para ver uma lista de equipes classificadas por contagem de erros, clique em Ver todos os escopos por contagem de erros.

Ver contagens de reinicialização por escopo

Esta seção mostra as equipes com o maior número de reinicializações de contêiner para a janela de tempo selecionada.

Para ver uma lista de equipes classificadas por reinicializações, clique em Ver todos os escopos por reinicializações.

Ativar o Cloud Monitoring do sistema para clusters de frotas

Conforme mencionado na seção Visualizar clusters, escopos de equipe e utilização total de recursos, as métricas no painel são geradas usando dados do Cloud Monitoring para componentes do cluster, como cargas de trabalho nos namespaces kube-system e gke-connect). Por isso, o Cloud Monitoring precisa estar ativado para todos os componentes do sistema, plano de controle e do Kube State Metrics dos clusters de membros da frota.

A maioria dos clusters do GKE e do GKE Enterprise tem o Cloud Logging e o Cloud Monitoring ativados por padrão, mas você ainda precisa ativar manualmente o Cloud Monitoring para todos os componentes do cluster. Os clusters anexados sempre exigem que você configure o Cloud Monitoring manualmente.

Se algum dos componentes do cluster da sua frota não tiver o Cloud Monitoring ativado, um painel será exibido na parte superior da página mostrando o número de clusters com dados ausentes.

Para ativar o Cloud Monitoring para componentes nesses clusters, consulte os guias a seguir de acordo com o tipo do cluster:

Ativar monitoramento para clusters registrados entre projetos

Para coletar e visualizar métricas em vários projetos do Google Cloud, o Cloud Monitoring permite que você crie escopos de métricas de vários projetos. Quando você registra um cluster do GKE de um projeto diferente no projeto host da frota, um novo escopo de métricas é criado automaticamente, incluindo os dois projetos (se ele ainda não existir). Isso permite ver os dados de utilização do cluster na visão geral.

A seguir

Saiba mais sobre as métricas de utilização de recursos no painel e como usá-las em Métricas de utilização de recursos
Saiba mais sobre como usar o Cloud Logging e o Cloud Monitoring para observar os clusters e as cargas de trabalho.