Como observar os clusters do GKE

Nesta página, você vê como acessar e usar o painel de monitoramento do Stackdriver Kubernetes Engine Monitoring e do Stackdriver legado.

Como acessar o painel de monitoramento

  1. No Console do Cloud, acesse o Monitoramento:

    Acessar o Monitoring

    Se o projeto do Google Cloud já estiver associado a um espaço de trabalho, a página inicial do Stackdriver Monitoring será exibida. Caso contrário, um espaço de trabalho será criado automaticamente. Em geral, esse processo não requer nenhuma ação sua, mas ele leva algum tempo para ser concluído. Em algumas situações, a caixa de diálogo Add your project to a Workspace é exibida. Nesse caso, a ação mais simples é criar um novo espaço de trabalho.

  2. Abra o painel da sua solução de monitoramento.

    Se a opção Resources não é exibida no painel de navegação, você está usando o Console do Cloud. Nesse caso, selecione Painéis:

    • Se os clusters usam o Stackdriver Kubernetes Engine Monitoring, selecione o painel Kubernetes Engine New.

      Esse painel exibe apenas os clusters que usam o Stackdriver Kubernetes Engine Monitoring. Se você não vir clusters ou não visualizar todos os recursos neles, consulte a seção Solução de problemas.

    • Se os clusters usam o Stackdriver legado, selecione o painel Kubernetes Engine.

    Se Resources é exibido no painel de navegação, você está usando o console clássico do Stackdriver Monitoring. Nesse caso, faça o seguinte:

    • Se os clusters usam o Stackdriver Kubernetes Engine Monitoring, selecione Resources e escolha Kubernetes Engine New.

      Esse painel exibe apenas os clusters que usam o Stackdriver Kubernetes Engine Monitoring. Se você não vir clusters ou não visualizar todos os recursos neles, acesse a seção Solução de problemas desta página.

    • Se os clusters usam o Stackdriver legado, selecione Resources e escolha Kubernetes Engine.

Interface do painel do Stackdriver Kubernetes Engine Monitoring

O painel do Stackdriver Kubernetes Engine Monitoring é dividido em três partes:

Visualização tabular do painel do Stackdriver Kubernetes Engine Monitoring.

  1. Com a barra de ferramentas do painel, você controla o período das observações e usa configurações e filtros do painel.

  2. Com o seletor de eventos da linha do tempo, você seleciona um horário específico e exibe resumos de alertas. Para informações detalhadas, acesse a seção Eventos da linha do tempo.

  3. Na seção de detalhes, você escolhe como as informações do cluster são apresentadas. Veja na próxima seção mais informações sobre as opções.

Como visualizar as guias

Com as guias de visualização do painel do Stackdriver Kubernetes Engine Monitoring, você organiza as informações do cluster por hierarquias diferentes:

  • Infrastructure: agrega recursos por Cluster, Node, Pod e Container

  • Workloads: agrega recursos por Cluster, Namespace, Workload, Pod e Container.

  • Services: agrega recursos por Cluster, Namespace, Service, Pod e Container.

Selecione o modo de visualização do Stackdriver Kubernetes Engine Monitoring.

A tabela é ordenada para mostrar primeiro os recursos com incidentes abertos. Para ver os subcomponentes de um recurso, clique no botão de expansão ao lado dele. Veja na captura de tela a seguir uma hierarquia expandida dos recursos do Kubernetes:

Exibição da hierarquia expandida dos recursos do Kubernetes.

Cada nome de recurso é precedido por um indicador vermelho ou verde. O indicador vermelho significa que o recurso ou um subcomponente dele têm um incidente aberto. Já o verde significa que não há incidentes abertos. Para ver os registros, métricas e detalhes de alertas de um recurso, clique na linha dele. Para mais detalhes, acesse a seção sobre Como visualizar alertas, métricas, registros e detalhes.

Definições de coluna

O painel do Stackdriver Kubernetes Engine Monitoring exibe dados em colunas com base no período selecionado:

  • Name: o rótulo atribuído ao recurso do Kubernetes.
  • Resource Type: os valores possíveis são Cluster, Container, Namespace, Node, Pod e Workspace.
  • Ready: o número de instâncias de nós disponíveis.
  • Incidents: o número de violações de alerta.
  • CPU Utilization: a porcentagem de utilização comparada aos recursos da CPU solicitados.
  • Memory Utilization: a porcentagem de utilização da memória solicitada.
  • Total Memory Usage: a quantidade de memória alocada.

Como visualizar alertas, métricas, registros e detalhes

Por padrão, o painel do Stackdriver Kubernetes Engine Monitoring exibe uma linha de resumo para cada recurso do Kubernetes. Cada recurso que tem um subcomponente é listado com um botão de expandir , e todos os recursos são listados com um indicador vermelho ou verde. O indicador vermelho significa que o recurso ou um subcomponente dele têm um incidente aberto. Já o verde significa que não há incidentes abertos:

  • Para ver os subcomponentes de um recurso, clique no botão de expansão ao lado dele.
  • Para abrir um painel que exibe um resumo de incidentes, métricas do sistema, registros e detalhes de um recurso, clique na linha do recurso. Quando você faz isso, as informações exibidas variam de acordo com o tipo de recurso. Por exemplo, ao clicar em uma linha de um cluster, você não verá informações de métricas ou de registros. No entanto, essas informações são exibidas quando você clica em uma linha de um pod.

    No exemplo a seguir, não há incidentes abertos no nó:

    Exibição dos detalhes de alertas do Kubernetes.

    Para acessar a página do Kubernetes no Console do Cloud, clique em Manage.

Eventos da linha do tempo

Também é possível acessar a visualização de detalhes de alertas no seletor de eventos da linha do tempo do painel do Stackdriver Kubernetes Engine Monitoring. A linha do tempo de incidentes inclui uma visualização das violações de alertas ocorridas no período selecionado. Se você colocar o cursor do mouse sobre uma área vermelha na linha do tempo, os cartões de evento serão exibidos:

Como usar a visualização da linha do tempo de um alerta do Kubernetes.

Cada cartão de evento fornece informações detalhadas sobre um incidente exibido na linha do tempo. Para visualizar os detalhes de alerta de um evento, clique no cartão dele.

Solução de problemas

Se a opção Kubernetes Engine NEW não está no menu Resource, isso indica que você não tem clusters do GKE que usam o Stackdriver Kubernetes Engine Monitoring. Da mesma forma, se o Kubernetes Engine não está listado, você não tem clusters do GKE que usam o Stackdriver legado.

Se você não vir nenhum recurso do Kubernetes no painel do Stackdriver Kubernetes Engine Monitoring, verifique o seguinte:

  • O projeto correto do Google Cloud está selecionado na parte superior da página? Caso contrário, use a lista suspensa na barra de menus para selecionar um projeto. Escolha aquele com os dados que você quer ver.

  • O projeto tem alguma atividade? Se você tiver acabado de criar o cluster, aguarde alguns minutos para que ele seja preenchido com dados. Consulte Como instalar o suporte ao Monitoring e Logging para mais detalhes.

  • O intervalo de tempo é muito limitado? Use o menu Time na barra de ferramentas do painel para selecionar outros períodos ou definir um intervalo personalizado.

  • Você tem as permissões adequadas para visualizar o painel? Se uma das mensagens de erro a seguir for exibida ao consultar os detalhes de implantação de um serviço ou as métricas de um projeto do Google Cloud, você precisará atualizar o papel do Cloud Identity and Access Management para incluir roles/monitoring.viewer ou roles/viewer:

    • You do not have sufficient permissions to view this page
    • You don't have permissions to perform the action on the selected resources

    Para mais detalhes, acesse Papéis predefinidos.

  • A conta de serviço do seu cluster tem permissão para gravar dados no Monitoring e no Logging? Se você vir altas taxas de erro no painel de API, talvez a conta de serviço não tenha os papéis a seguir:

    • roles/logging.logWriter: no Console do Google Cloud, esse papel é denominado Gravador de registros. Para mais informações sobre papéis do Logging, consulte o Guia de controle de acesso ao Logging.

    • roles/monitoring.metricWriter: no Console do Google Cloud, esse papel é denominado Gravador de métricas do Monitoring. Com ele, uma conta de serviço pode gravar dados de métricas em um espaço de trabalho. Para mais informações sobre os papéis do Monitoring, consulte o Guia de controle de acesso ao Monitoring.

    • roles/stackdriver.resourceMetadata.writer: no Console do Google Cloud, esse papel é denominado Gravador de metadados de recursos do Stackdriver. Ele fornece acesso somente de gravação a metadados de recursos e as permissões exatas necessárias para que os agentes enviem metadados. Para mais informações sobre os papéis do Monitoring, consulte o Guia de controle de acesso ao Monitoring.