Surveiller l'état

Cette page explique comment accéder aux tableaux de bord sur l'état de fonctionnement pour surveiller et identifier les problèmes potentiels.

L'état de santé vous aide à visualiser les métriques essentielles de l'infrastructure de votre appliance Google Distributed Cloud (GDC) isolée et fournit un aperçu général de l'état des composants. La visualisation des tableaux de bord sur l'état de santé vous aide à identifier les causes premières, à diagnostiquer les comportements et à obtenir un contexte supplémentaire lors de votre enquête pour résoudre les problèmes.

GDC surveille et fournit l'état de santé de chaque composant matériel et logiciel, y compris :

  • Matériel : nœud de serveur
  • Logiciels : clusters, VM et stockage

Les tableaux de bord d'état de santé vous permettent de visualiser les métriques avec lesquelles chaque composant mesure l'état de surveillance.

Avant de commencer

Les clusters racines contiennent une instance Grafana pour les opérateurs d'infrastructure. Ces instances Grafana contiennent les tableaux de bord sur l'état de santé.

Vous avez besoin de contrôles des accès basés sur les rôles pour accéder aux visualisations de données de manière sécurisée sur les tableaux de bord de l'instance Grafana. Pour cette raison, suivez les instructions de la section Avant de commencer à interroger et à afficher les métriques dans les tableaux de bord pour accéder aux tableaux de bord sur les instances Grafana.

Point de terminaison Grafana

Ouvrez l'une des URL suivantes pour accéder au point de terminaison Grafana du projet infra-obs ou du cluster d'administrateur racine :

  • Point de terminaison Grafana du projet infra-obs :

    https://GDC_URL/infra-obs/grafana
    

    Remplacez GDC_URL par l'URL d'une organisation dans GDC.

  • Point de terminaison Grafana du cluster d'administrateur racine :

    https://ROOT_ADMIN_CLUSTER_URL/grafana
    

    Remplacez ROOT_ADMIN_CLUSTER_URL par l'URL du cluster d'administrateur racine dans GDC.

Exemples de cas d'utilisation

Cette section inclut des exemples d'utilisation pratique du tableau de bord.

Réglage des performances

Si un composant ne fonctionne pas correctement, mais n'a pas nécessairement d'impact sur le SLO ni ne déclenche d'alertes, vous pouvez communiquer de manière proactive avec les développeurs et éviter que de futurs problèmes ne se produisent.

De même, un composant peut vouloir connaître le fonctionnement de sa fonctionnalité pour faire les bons compromis en termes de performances. L'état de santé est un mécanisme permettant de collecter les informations dont les composants ont besoin.

Développement de fonctionnalités

Supposons qu'un client demande des modifications ou que GDC prévoit de lancer une nouvelle fonctionnalité. Dans ce cas, vous pouvez observer l'état de santé des composants concernés pour déterminer la faisabilité de la prise en charge de la nouvelle fonctionnalité ou modification. L'état de santé peut également être utilisé pour prendre des décisions concernant les produits lors de la définition des priorités.

Par exemple, supposons qu'un composant ait une latence moyenne de 500 ms et qu'il soit intéressant de la réduire à 250 ms. Dans ce cas, l'équipe peut calculer le coût relatif d'une réduction incrémentielle de 50 % et le comparer à la conception d'un point de terminaison avec un temps de réponse de 250 ms.