Como observar os clusters do GKE

Nesta página, descrevemos como acessar os painéis de monitoramento de operações do Kubernetes Engine e do Logging e Monitoring legados e como usar o painel de monitoramento de operações do Kubernetes Engine.

Como acessar o painel de monitoramento

  1. No Console do Cloud, acesse o Monitoramento:

    Acessar Monitoring

    Se o projeto do Google Cloud já estiver associado a um espaço de trabalho, a página inicial do Cloud Monitoring será exibida. Caso contrário, um espaço de trabalho será criado automaticamente. Em geral, esse processo não requer nenhuma ação sua, mas ele leva algum tempo para ser concluído. Em algumas situações, a caixa de diálogo Add your project to a Workspace é exibida. Nesse caso, a ação mais simples é criar um novo espaço de trabalho.

  2. Selecione Painéis:

    • Se os clusters usam operações no Kubernetes Engine, selecione o painel Kubernetes Engine New.

    • Se os clusters usam o Logging e Monitoring legados, selecione o painel chamado Kubernetes Engine.

      Se você não vir nenhum cluster ou se não vir todos os recursos nos clusters, consulte Como solucionar problemas do painel do GKE.

Como ver métricas

Para clusters configurados com operações do Kubernetes Engine, os seguintes tipos de recursos monitorados estão disponíveis:

Por exemplo, para criar um gráfico do uso da CPU de um cluster configurado com as operações do Kubernetes Engine usando o Metrics Explorer, faça o seguinte:

  1. No Console do Google Cloud, acesse Monitoring ou use o botão
    Acessar Monitoring
  2. No painel de navegação do Monitoring, clique em Metrics Explorer.
  3. Verifique se Metric é a guia selecionada.
  4. Clique na caixa Find resource type and metric e, em seguida, insira ou selecione no menu o nome do recurso e da métrica. Use as informações a seguir para preencher os campos dessa caixa de texto:
    1. Em Recurso, selecione ou insira Kubernetes Container.
    2. Em Métrica, selecione ou insira Tempo de uso da CPU.
    Quando visualizadas como filtro, essas seleções correspondem aos seguintes itens: metric.type="kubernetes.io/container/cpu/core_usage_time" resource.type="k8s_container".

  5. Use os menus Filtro, Agrupar por e Agregação para modificar a exibição dos dados. Para exibir dados por namespace, em Agrupar por, selecione namespace_name. Essa seleção atualiza automaticamente a agregação, que define como várias séries temporais são combinadas. Para mais informações, consulte Como selecionar métricas.

Interface do painel de operações do Kubernetes Engine

O painel "Operações do Kubernetes Engine" é dividido em três partes:

Exiba a visualização tabular do painel de operações do Kubernetes Engine.

  1. Com a barra de ferramentas do painel, você controla o período das observações e usa configurações e filtros do painel.

  2. Com o seletor de eventos da linha do tempo, você seleciona um horário específico e exibe resumos de alertas. Para informações detalhadas, acesse a seção Eventos da linha do tempo.

  3. Na seção de detalhes, você escolhe como as informações do cluster são apresentadas. Veja na próxima seção mais informações sobre as opções.

Como visualizar guias

As guias de visualização do painel de operações do Kubernetes Engine permitem organizar as informações do cluster por diferentes hierarquias:

  • Infrastructure: agrega recursos por Cluster, Node, Pod e Container

  • Workloads: agrega recursos por Cluster, Namespace, Workload, Pod e Container.

  • Services: agrega recursos por Cluster, Namespace, Service, Pod e Container.

Selecione o modo de visualização

A tabela é ordenada para mostrar primeiro os recursos com incidentes abertos. Para visualizar os subcomponentes de um recurso, clique em expandir nesse recurso. Veja na captura de tela a seguir uma hierarquia expandida dos recursos do Kubernetes:

Exibição da hierarquia expandida dos recursos do Kubernetes.

Cada nome de recurso é precedido por um indicador vermelho ou verde. O indicador vermelho significa que o recurso ou um subcomponente dele têm um incidente aberto. Já o verde significa que não há incidentes abertos. Para ver os registros, métricas e detalhes de alertas de um recurso, clique na linha dele. Para mais detalhes, acesse a seção sobre Como visualizar alertas, métricas, registros e detalhes.

Definições de coluna

O painel "Operações do Kubernetes Engine" exibe dados em colunas com base no intervalo de tempo selecionado:

  • Name: o rótulo atribuído ao recurso do Kubernetes.
  • Resource Type: os valores possíveis são Cluster, Container, Namespace, Node, Pod e Workspace.
  • Pronto: o número de pods em execução agregados na entidade especificada. Uma marca de seleção indica que a entidade tem pelo menos um pod pronto e em execução. Esse indicador Pronto não é o mesmo que o Status do pod no Console do GKE. Pronto indica apenas que o pod está pronto para veicular tráfego, enquanto Status do pod exibe outros status, como Pendente, Em execução, Crashlooping, etc.
  • Incidents: o número de violações de alerta.
  • CPU Utilization: a porcentagem de utilização comparada aos recursos da CPU solicitados.
  • Memory Utilization: a porcentagem de utilização da memória solicitada.
  • Total Memory Usage: a quantidade de memória alocada.

Como visualizar alertas, métricas, registros e detalhes

O painel de operações do Kubernetes Engine exibe uma linha de resumo para cada recurso do Kubernetes por padrão. Cada recurso com um subcomponente é listado com um botão expandir e todos os recursos são listados com um indicador vermelho ou verde. O indicador vermelho significa que o recurso ou um subcomponente dele têm um incidente aberto. Já o verde significa que não há incidentes abertos:

  • Para visualizar os subcomponentes de um recurso, clique em expandir nesse recurso.
  • Para abrir um painel que exibe um resumo de incidentes, métricas do sistema, registros e detalhes de um recurso, clique na linha do recurso. Quando você faz isso, as informações exibidas variam de acordo com o tipo de recurso. Por exemplo, ao clicar em uma linha de um cluster, você não verá informações de métricas ou de registros. No entanto, essas informações são exibidas quando você clica em uma linha de um pod.

    No exemplo a seguir, não há incidentes abertos no nó:

    Exibição dos detalhes de alertas do Kubernetes.

    Para acessar a página do Kubernetes no Console do Cloud, clique em Manage.

Eventos da linha do tempo

Também é possível acessar o painel de detalhes do alerta no seletor de eventos da linha do tempo do painel de operações do Kubernetes Engine. A linha do tempo de incidentes inclui uma visualização das violações de alertas ocorridas no período selecionado. Se você colocar o cursor do mouse sobre uma área vermelha na linha do tempo, os cartões de evento serão exibidos:

Como usar a visualização da linha do tempo de um alerta do Kubernetes.

Cada cartão de evento fornece informações detalhadas sobre um incidente exibido na linha do tempo. Para visualizar os detalhes de alerta de um evento, clique no cartão dele.

Resolver problemas

Para informações sobre solução de problemas, consulte Solução de problemas no painel do GKE.