このページでは、ヘルス ステータス ダッシュボードにアクセスして、潜在的な問題をモニタリングして特定する方法について説明します。
健全性ステータスを使用すると、Google Distributed Cloud(GDC)エアギャップ アプライアンス インフラストラクチャの重要な指標を可視化し、コンポーネントの健全性の概要を確認できます。健全性ステータス ダッシュボードを可視化すると、根本原因の特定、動作の診断、問題解決のための調査中の追加コンテキストの取得に役立ちます。
GDC は、次の各ハードウェア コンポーネントとソフトウェア コンポーネントのモニタリングとヘルス ステータスの提供を行います。
- ハードウェア: サーバーノード
- ソフトウェア: クラスタ、VM、ストレージ
ヘルス ステータス ダッシュボードでは、各コンポーネントがモニタリング ステータスを測定する指標を可視化できます。
始める前に
ルートクラスタには、インフラストラクチャ オペレーター用の Grafana インスタンスが含まれています。これらの Grafana インスタンスには、ヘルス ステータス ダッシュボードが含まれています。
Grafana インスタンスのダッシュボードでデータ可視化に安全にアクセスするには、ロールベースのアクセス制御が必要です。そのため、始める前にセクションの手順に沿って、ダッシュボードで指標をクエリして表示し、Grafana インスタンスのダッシュボードにアクセスします。
Grafana エンドポイント
次のいずれかの URL を開いて、infra-obs
プロジェクトまたはルート管理クラスタの Grafana エンドポイントにアクセスします。
infra-obs
プロジェクトの Grafana エンドポイント:https://GDC_URL/infra-obs/grafana
GDC_URL は、GDC の組織の URL に置き換えます。
ルート管理クラスタの Grafana エンドポイント:
https://ROOT_ADMIN_CLUSTER_URL/grafana
ROOT_ADMIN_CLUSTER_URL は、GDC のルート管理クラスタの URL に置き換えます。
ユースケースの例
このセクションでは、ダッシュボードを実際のケースで使用する方法の例を紹介します。
パフォーマンスの調整
コンポーネントのパフォーマンスが低下しているものの、必ずしも SLO に影響したりアラートが発生したりしているわけではない場合は、デベロッパーに事前に連絡して、将来の問題の発生を防ぐことができます。
同様に、コンポーネントは、適切なパフォーマンスのトレードオフを行うために、その機能がどのように動作するかを知りたい場合があります。ヘルス ステータスは、コンポーネントに必要な情報を収集するメカニズムの 1 つです。
機能開発
お客様から変更のリクエストがあった場合や、GDC が新機能をリリースする予定がある場合を考えてみましょう。その場合は、関連するコンポーネントの健全性ステータスをモニタリングして、新機能や変更のサポートの実現可能性を判断できます。また、ヘルス ステータスは、作業の優先順位付けを行う際にプロダクトの意思決定を行うために使用できます。
たとえば、コンポーネントの平均レイテンシが 500 ミリ秒で、250 ミリ秒に短縮したいとします。この場合、チームは 50% のレイテンシ短縮の相対コストを計算し、250 ミリ秒のレスポンス タイムでエンドポイントを設計する場合と比較できます。