Registo e monitorização

O Google Distributed Cloud (apenas software) para VMware inclui várias opções para o registo e a monitorização de clusters, incluindo serviços geridos baseados na nuvem, ferramentas de código aberto e compatibilidade validada com soluções comerciais de terceiros. Este documento explica estas opções e fornece algumas orientações básicas sobre como selecionar a solução adequada para o seu ambiente.

Opções para o Google Distributed Cloud

Tem várias opções de registo e monitorização para o seu Google Distributed Cloud:

Cloud Logging e Cloud Monitoring

O Google Cloud Observability (anteriormente Stackdriver) é a solução de observabilidade integrada para o Google Cloud. Oferece uma solução de registo totalmente gerida, recolha de métricas, monitorização, painéis de controlo e alertas. O Cloud Monitoring monitoriza os clusters do Google Distributed Cloud de forma semelhante aos clusters do GKE baseados na nuvem.

Pode configurar os agentes no cluster para o âmbito da monitorização e do registo, bem como o nível das métricas recolhidas:

  • O âmbito do registo e da monitorização pode ser definido apenas para componentes do sistema (a predefinição) ou para componentes do sistema e aplicações
  • O nível de métricas recolhidas pode ser configurado para um conjunto otimizado de métricas ou para métricas completas

Consulte o artigo Configurar agentes de registo e monitorização para o Google Distributed Cloud neste documento para mais informações.

O Cloud Logging e o Cloud Monitoring oferecem uma solução ideal para os clientes que querem uma solução de observabilidade baseada na nuvem única, fácil de configurar e potente. Recomendamos vivamente o registo e a monitorização quando executar cargas de trabalho apenas no Google Distributed Cloud ou cargas de trabalho no GKE e no Google Distributed Cloud. Para aplicações com componentes em execução no Google Distributed Cloud e na infraestrutura no local tradicional, pode considerar outras soluções para uma vista ponto a ponto dessas aplicações.

Soluções de terceiros

A Google colaborou com vários fornecedores de soluções de registo e monitorização de terceiros para ajudar os respetivos produtos a funcionar bem com o Google Distributed Cloud. Estes incluem o Datadog, o Elastic e o Splunk. Serão adicionadas mais entidades terceiras validadas no futuro.

Para mais informações sobre a utilização de soluções de terceiros com o Google Distributed Cloud, consulte o seguinte:

Como funciona o registo e a monitorização do Google Distributed Cloud

Os agentes de registo e monitorização são instalados e ativados em cada cluster quando cria um novo cluster de administrador ou de utilizador. Os agentes recolhem dados sobre os componentes do sistema, cujo âmbito pode configurar.

Para ver os dados recolhidos na Google Cloud consola, tem de configurar o Google Cloud projeto que armazena os registos e as métricas que quer ver.

Os agentes de registo e monitorização em cada cluster incluem:

  • Agente de métricas do GKE (gke-metrics-agent). Um DaemonSet que envia métricas para a API Cloud Monitoring.

  • Encaminhador de registos (stackdriver-log-forwarder). Um Fluent Bit DaemonSet que encaminha registos de cada máquina para o Cloud Logging. O encaminhador de registos armazena em buffer as entradas de registo no nó localmente e reenvia-as durante um máximo de quatro horas. Se o buffer ficar cheio ou o encaminhador de registos não conseguir aceder à API Cloud Logging durante mais de quatro horas, os registos são ignorados.

  • Agente de métricas do GKE global (gke-metrics-agent-global). Uma implementação que envia métricas para a Cloud Monitoring API.

  • Agente de metadados (stackdriver-metadata-agent). Uma implementação que envia metadados para recursos do Kubernetes, como pods, implementações ou nós, para a API Stackdriver Resource Metadata. Estes dados são usados para enriquecer as consultas de métricas, permitindo-lhe consultar por nome de implementação, nome do nó ou até mesmo nome do serviço do Kubernetes.

  • kube-state-metrics Uma implementação que escuta o servidor da API e gera métricas sobre os estados dos objetos.

  • node-exporter: um DaemonSet que gera métricas de hardware e SO.

Pode ver todos os agentes de implementação executando o seguinte comando:

  kubectl --kubeconfig CLUSTER_KUBECONFIG get deployments -l "managed-by=stackdriver" --all-namespaces

em que CLUSTER_KUBECONFIG é o caminho para o ficheiro kubeconfig do cluster.

O resultado deste comando é semelhante ao seguinte:

gke-metrics-agent-global                      1/1     Running   0   4h31m
stackdriver-metadata-agent-cluster-level      1/1     Running   0   4h31m

Pode ver todos os agentes DaemonSet executando o seguinte comando:

  kubectl --kubeconfig CLUSTER_KUBECONFIG get daemonsets -l "managed-by=stackdriver" --all-namespaces

O resultado deste comando é semelhante ao seguinte:

gke-metrics-agent                             1/1     Running   0   4h31m
stackdriver-log-forwarder                     1/1     Running   0   4h31m

Configurar agentes de registo e monitorização para o Google Distributed Cloud

Os agentes instalados com o Google Distributed Cloud recolhem dados sobre os componentes do sistema, sujeitos às suas definições e configuração, para fins de manutenção e resolução de problemas com os seus clusters.

Apenas componentes do sistema (âmbito predefinido)

Após a instalação, os agentes recolhem registos e métricas, incluindo detalhes de desempenho (por exemplo, utilização da CPU e da memória) e metadados semelhantes para componentes do sistema fornecidos pela Google. Estes incluem todas as cargas de trabalho no cluster de administrador e, para clusters de utilizadores, cargas de trabalho nos espaços de nomes kube-system, gke-system, gke-connect, istio-system e config-management-system. Pode configurar ou desativar os agentes conforme descrito nas secções seguintes.

O âmbito dos registos e das métricas recolhidas pode ser expandido para incluir também aplicações. Para obter instruções sobre como ativar o registo e a monitorização de aplicações, consulte o artigo Ativar o registo e a monitorização de aplicações de utilizador.

Métricas otimizadas (métricas predefinidas)

Por predefinição, os agentes de métricas em execução no cluster recolhem e comunicam um conjunto otimizado de métricas de contentores, kubelet e kube-state-metrics para o Google Cloud Observability (anteriormente, Stackdriver).

São necessários menos recursos para recolher este conjunto de métricas otimizado, o que melhora o desempenho geral e a escalabilidade. Isto é especialmente importante para métricas ao nível do contentor e do kube, devido à grande quantidade de objetos a monitorizar.

Para desativar as métricas kube-state-metrics otimizadas (não recomendado), defina o campo optimizedMetrics como false no seu recurso personalizado do Stackdriver. Para mais informações sobre como alterar o seu recurso personalizado do Stackdriver, consulte o artigo Configurar recursos de componentes do Stackdriver. Todas as métricas do Google Distributed Cloud, incluindo as excluídas por predefinição, são descritas em Métricas do Google Distributed Cloud.

Ative e desative o Stackdriver

Pode ativar ou desativar completamente os agentes de registo e monitorização ativando ou desativando o recurso personalizado do Stackdriver. Esta funcionalidade está em pré-visualização.

Antes de desativar os agentes de registo e monitorização, consulte a página de apoio técnico para ver detalhes sobre como isto afeta os SLAs do apoio técnico. Google Cloud

Os agentes de registo e monitorização capturam dados armazenados localmente, sujeitos à sua configuração de armazenamento e retenção. Os dados são replicados para o projeto especificado na instalação através de uma conta de serviço autorizada a escrever dados nesse projeto. Google CloudPode desativar estes agentes em qualquer altura, conforme descrito anteriormente.

Também pode gerir e eliminar os dados que os agentes de registo e monitorização enviaram para o Cloud Logging e o Cloud Monitoring. Para mais informações, consulte a documentação do Cloud Monitoring.

Requisitos de configuração para registo e monitorização

Para ver os dados do Cloud Logging e do Cloud Monitoring, tem de configurar o Google Cloud projeto que armazena os registos e as métricas que quer ver. Este Google Cloud projeto é denominado projeto de monitorização de registos.

  1. Ative as seguintes APIs no seu projeto de registo e monitorização:

  2. Conceda as seguintes funções de IAM à conta de serviço de registo e monitorização no seu projeto de registo e monitorização.

    • logging.logWriter
    • monitoring.metricWriter
    • stackdriver.resourceMetadata.writer
    • monitoring.dashboardEditor
    • opsconfigmonitoring.resourceMetadata.writer

Etiquetas de registo

Muitos registos do Google Distributed Cloud têm uma etiqueta de F:

logtag: "F"

Esta etiqueta significa que a entrada de registo está concluída ou completa. Para saber mais acerca desta etiqueta, consulte o formato de registo nas propostas de design do Kubernetes no GitHub.

O que se segue?