Monitoraggio dello stato di integrità

Questa pagina descrive come accedere alle dashboard dello stato di integrità per monitorare e identificare potenziali problemi.

Lo stato di integrità ti aiuta a visualizzare le metriche essenziali dell'infrastruttura dell'appliance air-gapped di Google Distributed Cloud (GDC) e fornisce una panoramica di alto livello dell'integrità dei componenti. La visualizzazione delle dashboard sullo stato di integrità ti aiuta a identificare le cause principali, diagnosticare i comportamenti e ottenere un contesto aggiuntivo durante l'indagine per risolvere i problemi.

GDC monitora e fornisce lo stato di integrità di ogni componente hardware e software, tra cui:

  • Hardware: nodo server
  • Software: cluster, VM e spazio di archiviazione

Le dashboard dello stato di integrità ti consentono di visualizzare le metriche con cui ogni componente misura lo stato di monitoraggio.

Prima di iniziare

I cluster radice contengono un'istanza Grafana per gli operatori dell'infrastruttura. Queste istanze Grafana contengono le dashboard sullo stato di integrità.

Per accedere in modo sicuro alle visualizzazioni dei dati nelle dashboard dell'istanza Grafana, devi disporre di controlli degli accessi basati sui ruoli. Per questo motivo, segui le istruzioni della sezione Prima di iniziare per eseguire query e visualizzare le metriche nelle dashboard per accedere alle dashboard nelle istanze Grafana.

Endpoint Grafana

Apri uno dei seguenti URL per accedere all'endpoint Grafana del progetto infra-obs o del cluster di amministrazione principale:

  • Endpoint Grafana del progetto infra-obs:

    https://GDC_URL/infra-obs/grafana
    

    Sostituisci GDC_URL con l'URL di un'organizzazione in GDC.

  • Endpoint Grafana del cluster di amministrazione principale:

    https://ROOT_ADMIN_CLUSTER_URL/grafana
    

    Sostituisci ROOT_ADMIN_CLUSTER_URL con l'URL del cluster di amministrazione principale in GDC.

Esempi di casi d'uso

Questa sezione include esempi su come utilizzare la dashboard per casi pratici.

Ottimizzazione delle prestazioni

Se un componente ha un rendimento scarso, ma non influisce necessariamente sull'SLO o sull'attivazione degli avvisi, puoi comunicare in modo proattivo con gli sviluppatori e prevenire problemi futuri.

Allo stesso modo, un componente potrebbe voler sapere come funziona la sua funzionalità per fare i giusti compromessi in termini di prestazioni. Lo stato di salute è un meccanismo per raccogliere le informazioni necessarie ai componenti.

Sviluppo di funzionalità

Supponiamo che un cliente richieda modifiche o che GDC preveda di rilasciare una nuova funzionalità. In questo caso, puoi osservare lo stato di integrità dei componenti pertinenti per determinare la fattibilità del supporto della nuova funzionalità o modifica. Inoltre, lo stato di integrità può essere utilizzato per prendere decisioni sui prodotti quando si dà la priorità al lavoro.

Ad esempio, supponiamo che un componente abbia una latenza media di 500 ms e che si voglia ridurla a 250 ms. In questo caso, il team può calcolare il costo relativo di una riduzione incrementale del 50% e confrontarlo con la progettazione di un endpoint con un tempo di risposta di 250 ms.