サービスの健全性とインシデントを確認する


Google Kubernetes Engine(GKE)クラスタまたはアプリケーションで問題が発生した場合は、原因が内部にあるのか、より広範囲のGoogle Cloud サービス停止に関連しているのかを迅速に判断することが重要です。根本原因が既知のプラットフォーム インシデントである場合、ローカル デバッグに時間を費やすのは非効率的です。

このページでは、GKE クラスタの問題が広範囲にわたる Google Cloud サービスの中断によって発生しているかどうかを判断します。次のソースから、公式のステータス更新、パーソナライズされたヘルス イベント、サービス インシデントの分析情報を確認する方法について説明します。

  • Google Cloud Service Health: リージョン別の Google Cloudサービスのステータス情報。
  • Personalized Service Health: プロジェクトに関連するサービスの中断。
  • サービス インシデントの分析情報と推奨事項: 進行中のサービス インシデントの影響を受けている GKE クラスタ。

この情報は、トラブルシューティングを行っていて、観測された問題がより広範な Google Cloud サービス健全性イベントに関連しているかどうかを把握する必要があるプラットフォーム管理者、運用担当者、アプリケーション デベロッパーにとって重要です。Google Cloud のコンテンツで使用されている一般的なロールとタスクの例の詳細については、一般的な GKE ユーザーのロールとタスクをご覧ください。

Google Cloud サービス正常性を確認する

[Google Cloud Service Health] ページには、 Google Cloudに含まれるサービスのステータス情報が表示されます。

GKE 関連のインシデントを確認するには、Google Cloud Service Health ページに移動します。

Google Kubernetes Engine で報告されたすべてのインシデントに移動

Personalized Service Health を確認する

Personalized Service Health を使用すると、プロジェクトに関連するGoogle Cloud サービスの中断を特定できます。このような中断はサービス健全性イベントと呼ばれ、その情報は Google Cloud コンソールとさまざまなインテグレーション ポイントで確認できます。

プロジェクトに関連する GKE 関連のインシデントを確認するには、 Google Cloud コンソールの Personalized Service Health ダッシュボードでサービスヘルス イベントを表示します。

Personalized Service Health に移動する

インシデントは、サービス、場所、関連性、ステータスでフィルタできます。ダッシュボードには、影響範囲、症状、回避策、解決の進捗状況の更新など、インシデントの詳細も表示されます。開始するには、クイックスタート:Google Cloud コンソールでサービス ヘルス イベントを表示するをご覧ください。

サービス インシデントの分析情報と推奨事項を確認する

サービス インシデントの分析情報と推奨事項を使用すると、進行中のサービス インシデントの影響を受けている GKE クラスタを特定できます。

サービス インシデントの分析情報を取得するには、GKE_RELIABILITY_INCIDENT サブタイプの分析情報と推奨事項を表示します。分析情報は、 Google Cloud コンソール、Google Cloud CLI、または Recommender API を使用して取得できます。詳細については、分析情報と推奨事項を表示するをご覧ください。

分析情報と推奨事項には次の情報が含まれます。

  • 影響を受けるクラスタ: インシデントの影響を受けるクラスタ。
  • インシデント名: Cloud カスタマーケアとの連絡時に参照するインシデント ID。
  • インシデントの説明: インシデント対応チームからのインシデントに関する情報。
  • 最終有効時間: インシデントに関する情報が最後に更新された時刻。
  • 緩和策: インシデント対応チームが推奨する緩和策(利用可能な場合)。

サービス インシデントの分析情報は、 Google Cloud インシデント対応チームがインシデントを緩和し、分析情報が関連しなくなったと判断するまで表示されます。インシデントが軽減され、リソースに影響しなくなった時点と、分析情報が削除される時点の間には遅延が発生します。回避策を実装して分析情報を表示したくない場合は、分析情報を閉じることができます。

次のステップ