Como observar os clusters do GKE

Nesta página, descrevemos como acessar os painéis de monitoramento do Cloud Operations para GKE e Logging e Monitoring legados e como usar o painel de monitoramento do Cloud Operations para GKE.

Como acessar o painel de monitoramento

  1. No Console do Cloud, acesse o Monitoramento:

    Acessar o Monitoramento

  2. Selecione Painéis e escolha um dos seguintes painéis:

    • Para clusters com o Cloud Operations para GKE ativado, selecione o painel chamado GKE.

    • Para clusters com o Logging e o Monitoring legados ativados, selecione o painel chamado Clusters do GKE.

    Se você não vir nenhum cluster ou se não vir todos os recursos nos clusters, consulte Como solucionar problemas do painel do GKE.

Operações do Cloud para a interface do painel do GKE

O painel do Cloud Operations para GKE é dividido em várias partes:

Exibir a visualização tabular do painel do Cloud Operations para GKE.

  1. A barra de filtro permite selecionar quais recursos do GKE filtrar no painel.

  2. A linha do tempo de alertas permite que você selecione um período específico para seu painel e exiba um resumo de alertas durante esse período.

  3. As tabelas mostram sua frota do GKE por tipo: cluster, namespace, nó, cargas de trabalho, serviços, pods e contêineres. Cada linha mostra um único recurso com métricas. Ao clicar em uma linha, um painel com mais detalhes sobre o recurso é exibido.

Barra de filtro

A barra de filtro permite filtrar os recursos do GKE mostrados no painel para exibir os dados em que você tem interesse. Ele também exibe informações de outros recursos no cluster relacionados às seleções de filtro.

Como usar a barra de filtro

Para filtrar os dados no painel, siga estas etapas:

  1. Clique na barra de filtro para exibir as opções de filtro.

    Exibir as opções do filtro.

  2. Selecione um recurso do Kubernetes que queira filtrar e escolha o nome do recurso.

    Se mais de um recurso tiver esse nome, selecione a instância de recurso específica que você quer filtrar.

  3. Clique em Aplicar.

    O painel é atualizado para exibir as informações atualizadas.

Ao usar a barra de filtro, lembre-se dos seguintes pontos:

  • Depois de aplicar um filtro ao painel, clique novamente na barra de filtro para filtrar outros recursos.

  • Alguns recursos podem ter muitas opções para exibição no menu de filtros. Nesse caso, você precisa filtrar primeiro um recurso pai para restringir as opções. Por exemplo, talvez você tenha muitos pods para exibir. Portanto, é possível filtrar primeiro por cluster ou qualquer outro recurso do Kubernetes para restringir a lista de pods.

  • Para esclarecer o escopo de cada string de filtro, a interface de filtro pode exibir filtros adicionais por padrão, com base no recurso de filtragem. Por exemplo, se você filtrar por um namespace específico, o filtro adicionará o cluster em que o namespace reside.

    Exibir mais opções de filtro selecionadas pelo sistema.

Cronograma de alertas

A linha do tempo "Alertas" mostra os alertas nos clusters. A linha do tempo de alertas inclui uma visualização das violações de alertas ocorridas no período selecionado. Se você colocar o cursor do mouse sobre uma área vermelha na linha do tempo, os cards de evento serão exibidos:

Como usar a visualização da linha do tempo de um alerta do Kubernetes.

Cada cartão de evento fornece informações detalhadas sobre um alerta exibido na linha do tempo.

O menu suspenso "Período" permite definir o período da linha do tempo de alertas e as tabelas no painel.

Como usar os cards de eventos

Quando você passa o cursor sobre a linha do tempo de alertas, o painel exibe cards de eventos para cada violação. Um alerta com indica que o incidente ainda está aberto, enquanto um alerta com indica que o incidente está fechado.

Se o período selecionado tiver mais de dois alertas, use a roda do mouse para percorrer os cards de eventos. Também é possível clicar em Ver todos os alertas para exibir todos os cartões de evento em um painel.

Para ver o incidente de alertas em "Alertas", clique em Ver incidente.

Na seção Recurso associado, o card de evento mostra com qual recurso o alerta está associado. Se o painel não conseguir determinar com qual recurso o alerta está associado, o card de evento fornecerá um link para Atualizar política de alertas, que leva à página Editar política de alertas. Nesse local, é possível atualizar a política de alertas com informações adicionais para que o painel possa encontrar o recurso associado.

Tabelas de painel

O painel exibe uma tabela de métricas para cada recurso do GKE. As tabelas exibem as seguintes colunas:

  • Nome: o nome de exibição do recurso.

  • Alertas: o número de alertas abertos e confirmados para esse recurso e os filhos dele que ocorreram dentro do período selecionado.

  • Objetivos de nível de serviço (SLOs): uma declaração de desempenho desejado para seus serviços, conforme avaliada por meio do indicador de nível de serviço (SLI) selecionado.

  • Reinicializações do contêiner: o número de vezes que um contêiner foi reiniciado no período selecionado.

  • Registros de erros: o número de registros de erros associados a uma entidade com base no período selecionado.

  • Utilização da CPU: a utilização da CPU de contêineres que pode ser atribuída a um recurso dentro do período selecionado.

    • A métrica usada é kubernetes.io/container/cpu/request_utilization.
  • Utilização de memória: a utilização da memória de contêineres que pode ser atribuída a um recurso no período selecionado.

    • A métrica usada é kubernetes.io/container/memory/request_utilization.
  • Utilização do disco: a utilização do disco de pods que pode ser atribuída a um recurso dentro do período selecionado. Ao contrário das colunas anteriores, essa métrica é criada por pods e não é exibida na tabela Contêineres.

    • A métrica usada é kubernetes.io/pod/volume/utilization.

Para as colunas de utilização, lembre-se das seguintes informações:

  • Essas colunas não mostram uma proporção, mas estão exibindo dois pontos de dados diferentes, separados por /. O primeiro número mostra a capacidade total solicitada para esse recurso individual. O segundo número mostra a porcentagem de utilização da capacidade solicitada.

  • Os minigráficos mostram os dados de utilização ao longo do período selecionado na página.

Como configurar as tabelas do painel

Você pode configurar as tabelas no painel para exibir as informações que gostaria de ver. Usando o menu suspenso Configurar tabelas de recursos ao lado da barra de filtro, é possível selecionar as colunas a serem exibidas. Você também pode escolher mostrar ou não os minigráficos.

Essas configurações se aplicam a todas as tabelas do painel.

Exibição do menu suspenso "Configurar tabelas de recursos".

Para configurar suas tabelas, siga estas etapas:

  1. Selecione o menu suspenso "Configurar tabelas de recursos".

  2. Selecione as colunas a serem exibidas nas tabelas.

    As colunas Nome e Alertas ativos são obrigatórias.

  3. Escolha se você quer exibir minigráficos.

  4. Clique em Aplicar para fazer as alterações.

Como visualizar detalhes do recurso

Por padrão, o painel do Cloud Operations para GKE exibe uma linha de resumo para cada recurso do Kubernetes. Clicar em uma linha da tabela mostra os detalhes desse recurso.

Exibição de um detalhe de recurso.

O painel de detalhes do recurso exibe informações sobre o recurso selecionado. Também fornece uma guia Alertas com informações sobre alertas abertos e uma guia Eventos que exibe os eventos do Kubernetes associados ao recurso selecionado. Uma guia Métricas que exibe métricas em gráficos e uma guia Registros que exibe registros gerados pelo recurso.

Para ver o incidente de alertas em "Alertas", clique em Ver alertas.

Como visualizar eventos do Kubernetes

A guia Eventos no painel de detalhes do recurso exibe os eventos do Kubernetes associados a ele. Os eventos do Kubernetes estão disponíveis para todos os recursos, exceto contêineres.

Exibição de uma guia "Evento" para ver detalhes de um recurso.

A guia Eventos tem uma série de cartões que exibem informações sobre cada evento. O cartão também fornece um link para o recurso associado se o evento ocorrer em um recurso inferior. Clique em Ver registro para abrir o "Logs Explorer" e ver o registro associado ao evento. Também é possível clicar em Copiar mensagem para copiar a mensagem de registro para a área de transferência.

Para ver todos os eventos no Explorador de registros, clique em Visualizar no Logging. O Logs Explorer abre e exibe todos os registros associados aos eventos do Kubernetes.

Como gerenciar SLOs

É possível acompanhar a integridade e o desempenho dos seus aplicativos usando objetivos de nível de serviço (SLOs). Depois de configurar o painel para exibir a coluna Objetivos de nível de serviço (SLOs), veja se os aplicativos estão atendendo aos SLOs. O SLO do recurso pode ter um dos seguintes status:

  • Íntegro: indica que o recurso atende ao SLO especificado. Esse status tem um indicador verde.

  • Fora da margem de erro: indica que o recurso ultrapassou a margem de erro, o que significa que mais eventos inválidos podem fazer com que o recurso viole o SLO. Esse status tem um indicador amarelo.

  • Não íntegro: indica que o recurso está fora do SLO e tem um alerta que está sendo disparado. Esse status tem um indicador vermelho.

  • Sem status: indica que não há dados para o SLO. Esse status tem um indicador cinza.

Para mais informações sobre esses conceitos, consulte Conceitos no monitoramento de serviço.

Detalhes do SLO

Só é possível definir SLOs para os seguintes recursos do Kubernetes: namespaces, cargas de trabalho e serviços do Kubernetes. Para ver informações detalhadas sobre a conformidade do SLO do recurso, clique nele para abrir o painel de detalhes. No painel de detalhes, clique na guia SLOS.

Exibição da guia SLOs no painel de detalhes.

Criar SLO

É possível criar um SLO para o recurso do Kubernetes no painel de monitoramento do Cloud Operations para GKE.

Na página do painel do GKE, clique em na linha do recurso do Kubernetes para abrir o painel Criar um objetivo de nível de serviço (SLO).

No painel de detalhes do recurso, clique em Criar SLO para abrir o painel Criar um objetivo de nível de serviço (SLO).

Exibição do painel de criação de SLOs.

Para informações sobre como preencher o formulário para criar um SLO, consulte o guia Como criar um SLO.

Solução de problemas

Para informações sobre solução de problemas, consulte Solução de problemas no painel do GKE.