Configurar a geração de registros e o monitoramento;

Os clusters do Anthos em Bare Metal incluem várias opções de geração de registros e monitoramento de clusters, incluindo serviços gerenciados baseados em nuvem, ferramentas de código aberto e compatibilidade validada com soluções comerciais de terceiros. Nesta página, explicamos essas opções e fornecemos algumas orientações básicas sobre como selecionar a solução adequada para seu ambiente.

Opções para clusters do Anthos em Bare Metal

Há várias opções de geração de registros e monitoramento para os clusters do Anthos em Bare Metal:

  • Cloud Logging e Cloud Monitoring, ativados por padrão nos componentes do sistema Bare Metal.
  • O Prometheus e o Grafana estão disponíveis no Cloud Marketplace.
  • Configurações validadas com soluções de terceiros

Cloud Logging e Cloud Monitoring

O pacote de operações do Google Cloud é a solução de observabilidade integrada do Google Cloud. Ele oferece uma solução de geração de registros totalmente gerenciada, coleta de métricas, monitoramento, uso de painéis e emissão de alertas. O Cloud Monitoring monitora os clusters do Anthos em clusters Bare Metal de maneira semelhante aos clusters do GKE baseados na nuvem.

Os agentes podem ser configurados em dois níveis diferentes de geração de registros e monitoramento:

  • Somente componentes do sistema (padrão).
  • Componentes do sistema e aplicativos.

O Logging e o Monitoring fornecem uma solução ideal se você quiser uma única solução de observabilidade com base em nuvem, única e fácil de configurar. Recomendamos o Logging e o Monitoring ao executar cargas de trabalho apenas nos clusters Anthos em Bare Metal ou nas cargas de trabalho do GKE e dos clusters do Anthos em Bare Metal. Para aplicativos com componentes em execução nos clusters Anthos em Bare Metal que exigem infraestrutura local e tradicional, considere outras soluções para uma visão completa desses aplicativos.

Prometheus e Grafana

O Prometheus e o Grafana são dois produtos de monitoramento de código aberto conhecidos disponíveis no Cloud Marketplace:

  • O Prometheus coleta métricas de aplicativo e sistema.

  • O Alertmanager manipula o envio de alertas com vários mecanismos de alerta diferentes.

  • Grafana é uma ferramenta de painéis.

É possível ativar o Prometheus e o Grafana em cada cluster de administrador e cluster de usuário. Ambos são recomendados para equipes de aplicativos que tenham experiência anterior com esses produtos ou equipes operacionais que preferem manter as métricas de aplicativo dentro do cluster, bem como para solucionar problemas em caso de perda de conectividade da rede.

Soluções de terceiros

O Google trabalhou com vários provedores de soluções de monitoramento e geração de registros de terceiros para ajudar seus produtos a funcionarem bem com os clusters do Anthos em Bare Metal. Entre eles, Datadog, Elastic e Splunk. Outros terceiros validados serão adicionados no futuro.

Os guias de soluções a seguir estão disponíveis para usar soluções de terceiros com os clusters do Anthos em Bare Metal:

Como funciona a geração de registros e o monitoramento dos clusters do Anthos em Bare Metal

O Cloud Logging e o Cloud Monitoring são instalados e ativados em cada cluster quando você cria um novo cluster de administrador ou de usuário.

Os agentes do Stackdriver incluem vários componentes em cada cluster:

  • Operador do Stackdriver (stackdriver-operator-*). Gerencia o ciclo de vida de todos os outros agentes do Stackdriver implantados no cluster.

  • Recurso personalizado do Stackdriver. Um recurso que é criado automaticamente como parte dos clusters do Anthos no processo de instalação em Bare Metal.

  • Agregador de registros do Stackdriver (stackdriver-log-aggregator-*). Um StatefulSet do Fluentd que envia registros à API Cloud Logging. Se não for possível enviar os registros, o agregador de registros armazenará as entradas (até o limite de 200 GB) e tentará reenviá-las em até 24 horas. Se o buffer ficar cheio ou se o agregador de registros não conseguir acessar a API Logging por mais de 24 horas, os registros serão descartados.

  • Encaminhador de registros do Stackdriver (stackdriver-log-forwarder-*). Um daemonset do Fluentbit que encaminha registros de cada máquina para o agregador de registros do Stackdriver.

  • Coletor de metadados do Stackdriver (stackdriver-metadata-agent-). Uma implantação que envia metadados de recursos do Kubernetes (como pods, implantações ou nós) para a API Stackdriver Resource Metadata. Esses dados são usados para enriquecer consultas de métricas, permitindo que você consulte por nome da implantação, nome do nó ou até pelo nome do serviço do Kubernetes.

Para ver todos os agentes instalados pelo Stackdriver, execute o seguinte comando:

  kubectl -n kube-system get pods | grep stackdriver

A saída deste comando é semelhante a:

stackdriver-log-aggregator-0                  1/1     Running   0   4h31m
stackdriver-log-aggregator-1                  1/1     Running   0   4h28m
stackdriver-log-forwarder-bpf8g               1/1     Running   0   4h31m
stackdriver-log-forwarder-cht4m               1/1     Running   0   4h31m
stackdriver-log-forwarder-fth5s               1/1     Running   0   4h31m
stackdriver-log-forwarder-kw4j2               1/1     Running   0   4h29m
stackdriver-metadata-agent-cluster-level...   1/1     Running   0   4h31m
stackdriver-operator-76ddb64d57-4tcj9         1/1     Running   0   4h37m

Métricas do Cloud Monitoring

Para uma lista de métricas coletadas pelo Cloud Monitoring, consulte Métricas do Anthos no local e Anthos em bare metal.

Como configurar agentes do Stackdriver para os clusters do Anthos em Bare Metal

Os agentes do Stackdriver instalados com clusters do Anthos em Bare Metal coletam dados sobre os componentes do sistema, sujeitos às suas definições e configurações para manter e solucionar problemas com os clusters do Anthos em clusters Bare Metal, em um dos modos a seguir.

Somente componentes do sistema (modo padrão)

Após a instalação, os agentes do Stackdriver são configurados, por padrão, para coletar registros e métricas, incluindo detalhes de desempenho (por exemplo, uso de CPU e memória) e metadados semelhantes dos componentes de sistema fornecidos pelo Google. Isso inclui todas as cargas de trabalho no cluster de administrador e, para clusters de usuário, as cargas de trabalho nos namespaces kube-system, gke-system, gke-connect, istio-system e config-management-system.

Stackdriver desativado

Os agentes do Stackdriver podem ser completamente desativados, exceto o recurso Stackdriver personalizado. Cuidado: não recomendamos que você gerencie diretamente os recursos personalizados do Stackdriver.

Antes de desativar o Stackdriver, consulte a página de suporte para detalhes sobre como isso afeta os SLAs de suporte do Google Cloud.

Para desativar o Stackdriver para os clusters do Anthos em Bare Metal:

kubectl -n kube-system delete stackdrivers stackdriver

Os agentes do Stackdriver capturam dados armazenados localmente, dependendo da configuração de armazenamento e retenção. A replicação dos dados no projeto do Google Cloud especificado na instalação é feita com uma conta de serviço autorizada a gravar dados nesse projeto. Os agentes do Stackdriver podem ser desativados a qualquer momento, conforme descrito anteriormente. Os dados coletados pelos agentes do Stackdriver podem ser gerenciados e excluídos como qualquer outra métrica e dados de registro, conforme descrito na documentação do Cloud Monitoring.

Requisitos de configuração do Logging e do Monitoring

Há vários requisitos de configuração para ativar o Cloud Logging e o Cloud Monitoring com os clusters do Anthos em Bare Metal. Estas etapas estão incluídas em Como configurar uma conta de serviço para uso com o Logging e o Monitoring na página de ativação dos serviços do Google e na lista a seguir:

  1. É preciso criar um espaço de trabalho do Cloud Monitoring no projeto do Google Cloud. Para isso, clique em Monitoramento no console do Google Cloud e siga o fluxo de trabalho.
  2. Você precisa ativar as seguintes APIs do Stackdriver:

  3. Você precisa atribuir os seguintes papéis de IAM à conta de serviço usada pelos agentes do Stackdriver:

    • logging.logWriter
    • monitoring.metricWriter
    • stackdriver.resourceMetadata.writer
    • monitoring.dashboardEditor

Preço

Não há cobrança para registros e métricas do sistema do Anthos.

Em clusters do Anthos em cluster Bare Metal, os registros e métricas do sistema Anthos incluem o seguinte:

  • Registros e métricas de todos os componentes em um cluster de administrador
  • Registros e métricas de componentes nesses namespaces em um cluster de usuário: kube-system, gke-system, gke-connect, knative-serving, istio-system, monitoring-system, config-management-system, gatekeeper-system, cnrm-system

Para mais informações, consulte Preços do pacote de operações do Google Cloud.

Para saber mais sobre o crédito para métricas do Cloud Logging, entre em contato com a equipe de vendas e receba mais informações sobre preços.