Esta página descreve como pode compreender o estado de funcionamento das suas aplicações e manter a disponibilidade e a fiabilidade das aplicações.
Funcionalidades de observabilidade predefinidas
Por predefinição, os clusters do GKE estão configurados para fazer o seguinte:
- Enviar registos do sistema, registos de auditoria e registos de aplicações para o Cloud Logging.
- Enviar métricas do sistema para o Cloud Monitoring.
- Use o Google Cloud Managed Service for Prometheus para recolher métricas configuradas de terceiros e definidas pelo utilizador e, em seguida, enviá-las para o Cloud Monitoring. O serviço gerido do Google Cloud para Prometheus permite-lhe monitorizar e receber alertas sobre as suas cargas de trabalho através do Prometheus, sem gerir e operar manualmente o Prometheus à escala.
Personalize e melhore a recolha de dados
Por predefinição, o GKE cria um repositório do Logging para armazenar registos de cada cluster. Pode controlar que registos e que métricas, se existirem, são enviados do seu cluster do GKE para o Cloud Logging e o Cloud Monitoring.
Também pode controlar se quer ativar o Google Cloud Managed Service for Prometheus.
Para clusters do GKE Autopilot, não pode desativar a integração do Cloud Monitoring e Cloud Logging.
Métricas de observabilidade adicionais
Pode recolher métricas de observabilidade adicionais ativando um ou mais pacotes de métricas de observabilidade.
- Métricas do plano de controlo: Monitorize o estado dos componentes do Kubernetes recolhendo métricas para o servidor da API Kubernetes, o Scheduler e o Controller Manager. Estas métricas são sinais úteis do estado de funcionamento do serviço para definir objetivos ao nível do serviço (SLOs).
- Kube state metrics: Monitorize o estado dos objetos do Kubernetes, como implementações, nós e pods.
- Métricas cAdvisor/Kubelet: Monitorize o estado dos contentores e do kubelet.
Métricas de terceiros e definidas pelo utilizador
Para monitorizar aplicações de terceiros em execução nos seus clusters, como o Postgres, o MongoDB e o Redis, use os exportadores do Prometheus com o serviço gerido do Google Cloud para o Prometheus.
Também pode escrever exportadores personalizados para monitorizar outros sinais de estado e desempenho.
Use dados recolhidos
Use os dados que recolhe para analisar o estado de funcionamento das aplicações, depurar, resolver problemas e testar à medida que desenvolve, implementa e mantém as suas aplicações.
O GKE oferece funcionalidades de observabilidade integradas para começar rapidamente:
Veja os dados recolhidos para os seus clusters e cargas de trabalho nos painéis de controlo de observabilidade do GKE. Pode personalizar os painéis de controlo fornecidos para os seguintes fins:
- Veja as principais métricas do cluster, como a utilização da CPU, a utilização da memória e o número de incidentes abertos.
- Veja os clusters pela respetiva infraestrutura, cargas de trabalho ou serviços.
- Inspeção de espaços de nomes, nós, cargas de trabalho, serviços, pods e contentores.
- Para pods e contentores, veja métricas em função do tempo e veja entradas de registo.
Também pode criar os seus próprios painéis de controlo ou importar painéis de controlo do Grafana para satisfazer as suas necessidades.
No separador Observabilidade, pode criar políticas de alertas recomendadas para receber notificações sobre problemas. Para saber mais sobre os alertas, consulte a vista geral dos alertas.
Crie SLOs para monitorizar os objetivos de desempenho do seu serviço através das métricas do GKE recolhidas.
Use os playbooks do GKE para resolver problemas comuns, como pods não agendáveis e contentores que falham repetidamente após o reinício.
Explore e analise os seus dados com ferramentas como o Explorador de registos, Explorador de métricas e Relatórios de erros.
Reveja os registos de auditoria do GKE que registam atividades e acessos administrativos como parte dos registos de auditoria da nuvem. A política de registo de auditoria determina que eventos são registados e se uma entrada de registo pertence a um registo de atividade do administrador ou a um registo de acesso aos dados.
Outras funcionalidades
O GKE integra-se com outros Google Cloud serviços para ajudar a monitorizar e gerir os seus clusters e cargas de trabalho.
Use o painel de controlo da postura de segurança para identificar preocupações de segurança com base nas nossas normas e nas práticas recomendadas do setor.
Veja estatísticas e recomendações para otimizar os seus grupos.
Use o registo de políticas de rede para ajudar a resolver problemas com as políticas de rede do Kubernetes. Se usar o GKE Dataplane V2, o registo da política de rede está integrado.
Preços
O preço da integração com o Cloud Logging (incluindo os registos de auditoria do Google Cloud), o Cloud Monitoring e o serviço gerido do Google Cloud para Prometheus baseia-se na quantidade de registos e métricas recolhidos. Consulte a página Preços para ver detalhes.
As funcionalidades fornecidas por outros Google Cloud serviços indicados em Outras funcionalidades têm preços separados. Consulte a secção Preços dessas páginas de documentação para obter mais informações.
O que se segue?
Observe os seus clusters. Saiba como ver painéis de controlo, organizar informações de clusters e ver detalhes de alertas.
Ative o registo de auditoria detalhado ao nível do SO nos nós do cluster do GKE e como exportar registos para o Cloud Logging.
Para mais informações sobre como usar as funcionalidades de observabilidade para resolver problemas do GKE, consulte os artigos Realize análises históricas com o Cloud Logging e Realize uma monitorização proativa com o Cloud Monitoring.