Monitorar o status de integridade

Nesta página, descrevemos como acessar os painéis de integridade para monitorar e identificar possíveis problemas.

O status de integridade ajuda a visualizar as métricas essenciais da infraestrutura de appliance isolada do Google Distributed Cloud (GDC) e oferece uma visão geral de alto nível da integridade dos componentes. A visualização dos painéis de status de integridade ajuda a identificar causas raiz, diagnosticar comportamentos e obter mais contexto durante a investigação para resolver problemas.

O GDC monitora e fornece o status de integridade de cada componente de hardware e software, incluindo:

  • Hardware: nó do servidor
  • Software: clusters, VMs e armazenamento

Com os painéis de status de integridade, é possível visualizar as métricas com que cada componente mede o status de monitoramento.

Antes de começar

Os clusters raiz contêm uma instância do Grafana para operadores de infraestrutura. Essas instâncias do Grafana contêm os painéis de status de integridade.

Você precisa de controles de acesso baseados em função para acessar visualizações de dados com segurança nos painéis da instância do Grafana. Por isso, siga as instruções da seção Antes de começar a consultar e visualizar métricas nos painéis para acessar os painéis nas instâncias do Grafana.

Endpoint do Grafana

Abra um dos seguintes URLs para acessar o endpoint do Grafana do projeto infra-obs ou do cluster de administrador raiz:

  • Endpoint do Grafana do projeto infra-obs:

    https://GDC_URL/infra-obs/grafana
    

    Substitua GDC_URL pelo URL de uma organização no GDC.

  • Endpoint do Grafana do cluster de administrador raiz:

    https://ROOT_ADMIN_CLUSTER_URL/grafana
    

    Substitua ROOT_ADMIN_CLUSTER_URL pelo URL do cluster de administrador raiz no GDC.

Exemplos de casos de uso

Esta seção inclui exemplos de como usar o painel em casos práticos.

Ajuste de desempenho

Se um componente estiver com desempenho ruim, mas não afetar necessariamente o SLO ou disparar alertas, você poderá se comunicar de forma proativa com os desenvolvedores e evitar problemas futuros.

Da mesma forma, um componente pode querer saber como o recurso funciona para fazer as compensações de desempenho certas. O status de integridade é um mecanismo para coletar as informações necessárias aos componentes.

Desenvolvimento de recursos

Suponha que um cliente peça mudanças ou que a GDC planeje lançar um novo recurso. Nesse caso, observe o status de integridade dos componentes relevantes para determinar a viabilidade de oferecer suporte ao novo recurso ou mudança. Além disso, o status de integridade pode ser usado para tomar decisões sobre produtos ao priorizar o trabalho.

Por exemplo, suponha que um componente tenha uma latência média de 500 ms e queira reduzir para 250 ms. Nesse caso, a equipe pode calcular o custo relativo de uma redução incremental de 50% e comparar com o design de um endpoint com tempo de resposta de 250 ms.