監控健康狀態

本頁說明如何存取健康狀態資訊主頁,監控及找出潛在問題。

健康狀態可協助您以視覺化方式呈現 Google Distributed Cloud (GDC) 氣隙裝置基礎架構的重要指標,並提供元件健康狀態的高階總覽。健康狀態資訊主頁的視覺化呈現方式,有助於您找出根本原因、診斷行為,以及在調查期間取得額外背景資訊,以解決問題。

GDC 會監控並提供各項軟硬體元件的健康狀態,包括:

  • 硬體:伺服器節點
  • 軟體:叢集、VM 和儲存空間

健康狀態資訊主頁可讓您以圖表呈現各元件用來評估監控狀態的指標。

事前準備

根叢集包含基礎架構運算子的 Grafana 執行個體。這些 Grafana 執行個體包含健康狀態資訊主頁。

您需要角色式存取控管,才能在 Grafana 執行個體的資訊主頁上安全地存取資料視覺化內容。因此,請按照「事前準備」一節的指示,查詢及查看資訊主頁上的指標,存取 Grafana 執行個體上的資訊主頁。

Grafana 端點

開啟下列任一網址,存取 infra-obs 專案或根管理員叢集的 Grafana 端點:

  • infra-obs 專案的 Grafana 端點:

    https://GDC_URL/infra-obs/grafana
    

    GDC_URL 替換為 GDC 中機構的網址。

  • 根管理員叢集的 Grafana 端點:

    https://ROOT_ADMIN_CLUSTER_URL/grafana
    

    ROOT_ADMIN_CLUSTER_URL 替換為 GDC 中根管理員叢集的網址。

應用實例範例

本節提供實用案例,說明如何使用資訊主頁。

效能調整

如果元件效能不佳,但未影響服務水準目標或觸發警報,您可以主動與開發人員溝通,防止日後發生問題。

同樣地,元件可能想瞭解其功能運作方式,以便做出正確的效能取捨。健康狀態是收集元件所需資訊的機制之一。

功能開發

假設客戶要求變更,或 GDC 打算發布新功能。在這種情況下,您可以觀察相關元件的健康狀態,判斷是否能支援新功能或變更。此外,在決定工作優先順序時,健康狀態可用於制定產品決策。

舉例來說,假設某個元件的平均延遲時間為 500 毫秒,且團隊希望將延遲時間縮短至 250 毫秒,那麼團隊可以計算延遲時間減少 50% 的相對成本,並與設計回應時間為 250 毫秒的端點進行比較。