Observabilidade para o GKE


Nesta página, descrevemos como entender a integridade dos aplicativos e manter a disponibilidade e a confiabilidade deles.

Quando você cria um cluster do GKE, o Cloud Logging, o Cloud Monitoring e o Google Cloud Managed Service para Prometheus são ativados por padrão e fornecem observabilidade especificamente personalizada para o Kubernetes.

  • Use os painéis integrados para conferir métricas e registros padrão, além de configurar alertas recomendados.
  • Ative outros pacotes de observabilidade para monitorar os componentes e os objetos do Kubernetes e usar os dados coletados na depuração e na solução de problemas.
  • Configure a coleta de dados para aplicativos de terceiros em execução nos clusters.
  • Defina métricas, painéis e alertas próprios para atender às suas necessidades.

Além da integração com o Cloud Logging e o Cloud Monitoring, o GKE também fornece outros recursos para ajudar você a observar e manter a integridade dos aplicativos.

Recursos de observabilidade padrão

Por padrão, os clusters do GKE são configurados para fazer o seguinte:

Personalizar e aprimorar a coleta de dados

É possível controlar quais registros e quais métricas, se houver, serão enviados do cluster do GKE para o Cloud Logging e o Cloud Monitoring.

Também é possível controlar se o Google Cloud Managed Service para Prometheus será ativado. Para mais instruções de configuração, consulte Como configurar a geração de registros e o monitoramento do GKE.

Para clusters Autopilot do GKE, não é possível desativar a integração do Cloud Monitoring e do Cloud Logging.

Outras métricas de observabilidade

É possível coletar mais métricas de observabilidade ativando um ou mais pacotes de métricas de observabilidade:

  • Métricas do plano de controle: monitore a integridade dos componentes do Kubernetes coletando métricas do servidor da API do Kubernetes, do programador e do gerenciador de controladores. Essas métricas são sinais úteis da integridade do serviço para definir objetivos de nível de serviço (SLOs).
  • Kube State Metrics: monitore a integridade dos objetos do Kubernetes, como implantações, nós e pods.

Se você tiver ativado o GKE Enterprise no seu projeto, essas métricas serão ativadas por padrão quando você se registrar em uma frota durante a criação do cluster.

Métricas de terceiros e definidas pelo usuário

A fim de monitorar aplicativos de terceiros em execução nos clusters, como o Postgres, o MongoDB e o Redis, use os exportadores do Prometheus com o Google Cloud Managed Service para Prometheus.

Também é possível programar exportadores personalizados para monitorar outros sinais de integridade e desempenho.

Usar os dados coletados

Use os dados coletados para analisar a integridade do aplicativo, realizar depurações, solucionar problemas e fazer testes durante o desenvolvimento, a implantação e a manutenção dos aplicativos.

O GKE fornece recursos de observabilidade integrados para que você comece a trabalhar rapidamente:

  • Confira os dados coletados dos clusters e das cargas de trabalho nos painéis de observabilidade do GKE. Você pode personalizar os painéis fornecidos para as seguintes finalidades:

    • Confira as principais métricas do cluster, como a utilização da CPU e da memória, além do número de incidentes em aberto.
    • Confira os clusters por infraestrutura, cargas de trabalho ou serviços.
    • Inspecione namespaces, nós, cargas de trabalho, serviços, pods e contêineres.
    • Para pods e contêineres, confira as métricas como uma função de tempo e as entradas de registro.

    Também é possível criar seus próprios painéis ou importar painéis do Grafana para atender às suas necessidades.

  • Na guia Observabilidade, é possível criar políticas de alertas recomendadas para receber notificações sobre problemas. Para saber mais sobre alertas, consulte a Visão geral de alertas.

  • Crie SLOs para monitorar as metas de desempenho do serviço usando as métricas coletadas do GKE.

  • Use os playbooks do GKE para resolver problemas comuns, como pods não programáveis e contêineres que falham repetidamente após a reinicialização.

  • Explore e analise dados com ferramentas como a Análise de registros, o Metrics Explorer e o Error Reporting.

  • Analise os registros de auditoria do GKE que registram atividades administrativas e acessos como parte dos Registros de auditoria do Cloud. A política de registros de auditoria determina quais eventos são gravados e se uma entrada de registro pertence a um registro de atividades do administrador ou a um registro de acesso a dados.

Outros recursos

O GKE se integra a outros serviços do Google Cloud para ajudar você a monitorar e gerenciar clusters e cargas de trabalho.

Preços

Os preços da integração com o Cloud Logging (incluindo os Registros de auditoria do Cloud), o Cloud Monitoring e o Google Cloud Managed Service para Prometheus são baseados na quantidade de registros e métricas coletados. Veja detalhes na página Preços.

Os recursos fornecidos por outros serviços do Google Cloud listados em Outros recursos têm preços separados. Para mais informações, consulte a seção "Preços" dessas páginas de documentação.

A seguir