Como observar os clusters do Kubernetes

O Stackdriver permite consultar informações de monitoramento e registro nos clusters e nos contêineres de aplicativos do Google Kubernetes Engine por meio de um único painel.

Primeiros passos

  1. No Console do GCP, acesse a página inicial do Stackdriver Monitoring selecionando Stackdriver > Monitoring. Clique no seguinte botão para acessá-la:

    Acessar o console do Stackdriver Monitoring

  2. Selecione o espaço de trabalho que contém o cluster do Google Kubernetes Engine:

    • Na maioria dos casos, o espaço de trabalho é o projeto do Google Cloud Platform que contém o cluster do Google Kubernetes Engine.
    • Você pode ser solicitado a criar um espaço de trabalho ou talvez não veja o projeto do GCP na lista de contas. Nesses casos, você precisa criar um novo espaço de trabalho usando o projeto do GCP. Para mais informações, consulte Como criar uma conta do Stackdriver.
    • Para monitorar clusters de vários projetos no mesmo painel, você precisa criar um espaço de trabalho diferente dos projetos do GCP. Para mais informações, consulte Como monitorar vários projetos.
  3. Navegue até o console de monitoramento do Kubernetes:

    1. Se você estiver usando o Stackdriver legado, selecione Resources > Kubernetes Engine.

    2. Se você estiver usando o Stackdriver Kubernetes Engine Monitoring, selecione Resources > Kubernetes Engine NEW.

      Você só verá esses itens de menu se tiver clusters que usem o Stackdriver.

    Acessar o console do Stackdriver Kubernetes Monitoring

    Este console mostra apenas os clusters que usam o Stackdriver Kubernetes Monitoring. Se nenhum cluster for exibido ou se não for possível visualizar todos os recursos, consulte a seção Solução de problemas nesta página.

Interface do painel do Stackdriver Kubernetes Engine Monitoring

O painel do Stackdriver Kubernetes Engine Monitoring é dividido em várias partes, conforme indicado pelos números vermelhos na captura de tela abaixo:

Visualização tabular do Kubernetes

  1. A barra de ferramentas do painel fornece configurações do painel, filtragem e controle sobre a linha do tempo mostrada abaixo dela.

  2. Com o seletor de eventos da linha do tempo, você passa o cursor sobre a linha do tempo para revelar resumos de violações de alertas. Consulte a seção Eventos da linha do tempo abaixo.

  3. A seção de detalhes permite escolher dentre três guias de visualização: Infrastructure, Workloads e Services. Essas guias são abordadas na seção Como visualizar guias abaixo.

Como visualizar guias

O painel fornece várias guias de visualização, que organizam as informações do cluster de diferentes maneiras. As guias de visualização possíveis são:

  • Infrastructure. Agrega recursos do Kubernetes nesta hierarquia: Cluster > Node > Pod > Container.

  • Workloads. Agrega recursos do Kubernetes nesta hierarquia: Cluster > Namespace > Workload > Pod > Container.

  • Services. Agrega recursos do Kubernetes nesta hierarquia: Cluster > Namespace > Service > Pod > Container.

É possível selecionar o modo de visualização nas guias acima da seção de detalhes:

Detalhes de evento do Kubernetes

A tabela é ordenada para mostrar primeiro os recursos do Kubernetes com incidentes abertos. Clique na seta expansora (▸) na frente de cada recurso do Kubernetes para examinar os subcomponentes dele. A captura de tela a seguir mostra uma hierarquia expandida de recursos do Kubernetes:

Detalhes de evento do Kubernetes

Cada nome de recurso é precedido por um indicador. Se estiver vermelho, ele informa que ocorreram incidentes nesse recurso ou em recursos inferiores na hierarquia. Para ver os detalhes do alerta, clique em Nome. Para ver mais detalhes, consulte a seção Detalhes do alerta abaixo.

Definições de coluna

Veja a seguir explicações sobre as colunas exibidas nas três guias. Os valores exibidos são baseados no intervalo de tempo selecionado:

  • Name: o rótulo atribuído ao recurso do Kubernetes.
  • Resource Type: os valores possíveis são Cluster, Container, Namespace, Node, Pod e Workspace.
  • Ready: o número de instâncias de nós disponíveis.
  • Incidents: o número de violações de alerta.
  • CPU Utilization: a porcentagem de utilização comparada aos recursos da CPU solicitados.
  • Memory Utilization: a porcentagem de utilização da memória solicitada.
  • Total Memory Usage: a quantidade de memória alocada.

Detalhes do alerta

O painel do Kubernetes Monitoring exibe uma linha de resumo para cada recurso do Kubernetes por padrão. Para ver os detalhes do recurso, clique na seta expansora (▸) na frente do recurso do Kubernetes.

Se você clicar nos botões vermelho ou verde na frente da entrada, um painel com detalhes de alerta será exibido:

Detalhes de evento do Kubernetes

Essa exibição de detalhes agrupa incidentes, métricas do sistema e registros em uma única visualização.

Eventos da linha do tempo

Também é possível acessar o painel de detalhes de alerta no seletor de eventos da linha do tempo, na parte superior da tela. Uma linha do tempo de incidentes apresenta uma visão de como alertar violações ocorridas dentro do período selecionado. Se você passar o cursor sobre as áreas vermelhas na linha do tempo, os cartões de evento serão exibidos:

Visualização de linha do tempo do Kubernetes

Os cartões de evento fornecem mais informações sobre cada incidente exibido na linha do tempo. Se clicar em um cartão de evento individual, você verá os detalhes de alerta do incidente em um novo painel:

Gráfico de bolhas

O painel do Kubernetes Monitoring apresenta uma visualização de bolhas que permite explorar tendências e padrões exibidos nas métricas. Ele também fornece informações de integridade instantâneas sobre os nós no cluster.

Gráfico de bolhas de exemplo

Tenha em mente as seguintes informações ao visualizar o gráfico:

  • Cada bolha representa um nó. O tamanho dele (tamanho de plotagem) representa o número de pods no nó.

  • Uma plotagem cinza indica um nó íntegro, uma plotagem vermelha indica um nó com um incidente em aberto.

  • Para a versão Beta, selecione CPU Usage e Memory Usage para os eixos do gráfico. Você também poderá selecionar GPU Usage se os nós estiverem usando GPUs.

Solução de problemas

Se nenhum recurso do Kubernetes for exibido no painel, faça estas verificações:

  • O projeto do GCP correto está selecionado na parte superior da página? Se não estiver selecionado, use o menu suspenso no topo da página para selecionar um projeto. Você precisa selecionar o projeto com os dados que quer ver.

  • O projeto tem alguma atividade? Se você tiver acabado de criar o cluster, aguarde alguns minutos para que ele seja preenchido com dados. Consulte Como instalar o suporte do Stackdriver para detalhes.

  • O intervalo de tempo é muito limitado? Use o menu Time na barra de ferramentas do painel, na parte superior da página, para selecionar outros intervalos de tempo ou definir um intervalo Custom.

  • Você tem as permissões indicadas para visualizar o painel? Se vir uma das mensagens de erro a seguir de permissão negada ao visualizar detalhes de implantação de um serviço ou métricas de um projeto do GCP, você precisará atualizar o papel do Cloud Identity and Access Management para incluir roles/monitoring.viewer ou roles/viewer:

    • You do not have sufficient permissions to view this page
    • You don't have permissions to perform the action on the selected resources

    Para mais detalhes, acesse Papéis predefinidos.

  • A conta de serviço do cluster tem permissão para gravar dados no Stackdriver? Se você vir altas taxas de erro no painel de API, talvez a conta de serviço não tenha as seguintes funções:

    • metricWriter
    • logWriter
    • Editor de metadados de recursos do Stackdriver
Esta página foi útil? Conte sua opinião sobre:

Enviar comentários sobre…

Stackdriver Monitoring
Precisa de ajuda? Acesse nossa página de suporte.