このドキュメントでは、 Google Cloud プロジェクトに関連するサービス中断を特定し、効率的に管理して対応できるようにする Personalized Service Health の概要について説明します。これらの中断はサービス ヘルス イベントと呼ばれ、Google Cloud コンソールとさまざまなインテグレーション ポイントで使用できます。
Personalized Service Health の仕組み
次の図は、Personalized Service Health でサービス ヘルス イベントを利用できるようにする方法を示しています。
サービス ヘルス イベントには、次の方法でアクセスできます。
- Service Health ダッシュボード: プロジェクトに関連する新しいインシデントやアクティブなインシデントを追跡します。 Google Cloud
- Service Health API: プロジェクトまたは組織ごとにサービス ヘルス イベント情報を取得します。
- アラート: プロジェクトに関連するイベントの通知を受け取ります。アラートは Cloud Logging のログに基づいています。
- ログ: イベントに関連するログをエクスポートします。 Google Cloud
Service Health ダッシュボードでアクティブなインシデントや過去のインシデントを表示する Google Cloud
Google Cloud コンソールの Service Health ダッシュボードには、プロジェクトに関連するインシデント、そのステータス、影響を受けるGoogle Cloud プロダクトとロケーションが表示されます。
Service Health ダッシュボードにアクセスする方法については、クイックスタートをご覧ください。
モバイル デバイスで Google Cloud インシデントを表示し、アラートを受信する
サービス ヘルス ダッシュボードはモバイル デバイスでも利用可能です。
モバイル デバイスでアラートを受信するには、アラート ポリシーを構成して、モバイル デバイスにアラートを送信します。
Service Health API を使用してサービス ヘルス イベントをリクエストする
Service Health API を使用すると、プロジェクトに影響を与えている可能性のある Service Health イベントや、影響を与えたイベントの詳細(更新、開始時間、終了時間、影響を受けるプロダクトとロケーション、ステータスなど)を取得できます。 Google Cloud
詳細については、Service Health API リファレンスをご覧ください。
Cloud Logging でアラートを構成する、またはログをエクスポートする
Personalized Service Health は、サービス ヘルス イベントを Cloud Logging にログに記録し、これらのログに基づいてアラートを設定できます。新しいインシデントが発生したとき、既存のインシデントが更新されたとき、特定の Google Cloud プロダクトまたはロケーションのインシデントが作成または更新されたときなどの条件にアラートを設定できます。
Service Health ダッシュボードでアラートを設定する方法については、クイックスタートをご覧ください。
コンセプト
Personalized Service Health では、次のコンセプトを使用して、プロジェクトに影響するイベントと、これらのイベントがプロジェクトにどのように関連しているかを示します。
サービスの正常性イベント
サービス ヘルスのイベント(v1、v1beta)は、プロジェクトまたはリソースに関連するプロダクトに影響する中断イベントです。 Google Cloud たとえば、ネットワークの停止、構成エラー、パフォーマンスの問題などです。
各イベントには、イベントの全体的な影響、Google からの最新情報、 Google Cloud プロジェクトに固有の情報が含まれています。
インシデント
インシデントは、プロジェクトに関連する新しいアクティブな Google Cloud サービス停止またはサービス低下です。これはサービス ヘルスイベントのカテゴリです。
インシデントには次のものが含まれます。
- インシデントの影響: 影響を受けるGoogle Cloud プロダクトやロケーションなど、イベントの範囲の詳細。
- Google Cloudからの最新情報:Google Cloud サポートからの定期的な最新情報。
- パーソナライズされた関連性: インシデントからプロジェクトへの関連性。 Google Cloud
- 症状、回避策、予定時刻: 影響の評価、回避策の適用、根本原因の詳細の把握に役立つ情報。
インシデントにはインシデント レポートが関連付けられている場合があります。このレポートには、インシデントの原因となった要因と、同様のインシデントの再発を防ぐために Google が講じる予定の対策が記載されます。 Google Cloud インシデント レポートは、次の条件を満たすインシデントに対して使用できます。
- インシデントがグローバルに影響を与えている、または 1 つ以上のリージョンでお客様のプロジェクトの相当な割合に影響を与えている。
- 1 つ以上のサービスが利用できないか、大幅に低下している。
イベントの状態と詳細な状態
イベントには、状態を示す 2 つのフィールドがあります。これらのフィールドの値は、イベントの進展に伴って変化します。
イベントの状態: イベントの全体的な状態を示します。次のいずれかになります。
- アクティブ: イベントが現在影響を及ぼしており、 Google Cloud 引き続き更新されます。
- クローズ済み: イベントがプロダクトに影響しなくなったか、別のイベントと統合されました。 Google Cloud
詳細なステータス: イベントのステータスの詳細を提供します。インシデントにのみ適用され、イベントの状態に応じて次のいずれかの値になります。
新しい問題: Google のエンジニアがインシデントを積極的に調査し、影響を特定しています。新しいインシデントは、影響評価が完了すると、確認済みインシデントまたは解決済みインシデントになります。アクティブなインシデントは新しいインシデントである可能性があります。
新しいインシデントのサポートは、 Google Cloudネットワーキング プロダクトでのみ利用できます。
確認済み: Google のエンジニアによってインシデントが確認され、少なくとも 1 つの Google Cloud プロダクトに影響しています。解決するまで、ステータスの最新情報を提供します。
アクティブなインシデントは、確認済みインシデントである場合があります。
Merged: インシデントが親インシデントに統合されました。今後の更新はすべて親にのみ公開されます。
解決済み: 対応後、インシデントがどのプロダクトにも影響しなくなった。 Google Cloud今後、更新情報は提供されません。
クローズされたインシデントは通常、解決済みインシデントです。
偽陽性: 調査の結果、Google のエンジニアは、この事象がプロダクトに影響していないと結論付けました。 Google Cloud インシデントが再審査されると、このステータスは変更される可能性があります。
自動クローズ: 次の理由により、インシデントが自動的にクローズされました。
- インシデントの影響を特定できませんでした。
- インシデントが断続的に発生したか、自然に解決した。
対応や調査が行われていないため、インシデントの解決はありません。断続的に発生する場合は、インシデントが再オープンされることがあります。
関連性
Personalized Service Health は、すべてのインシデントによるプロジェクトへの影響を評価します。インシデントによるプロジェクトへの影響が想定される場合や、影響が確認された場合は、Service Health ダッシュボードと API で確認できます。
[関連性] は、インシデントがプロジェクトに与える影響を説明します。関連性は、インシデントの進行に伴い変化する可能性があります。
関連性は次のいずれかの値になります。
- 影響あり: このインシデントがプロジェクトに影響していることが確認されています。一部の Google Cloud 商品のみご利用いただけます。
- 関連: このインシデントはユーザーのプロジェクトに直接関係しています。プロジェクトで使用しているロケーションにある Google Cloud プロダクトに影響を与えます。
- 部分的に関連する: このインシデントは、プロジェクトで使用しているプロダクトに関連付けられていますが、プロジェクトには影響しない場合があります。 Google Cloudたとえば、プロジェクトで使用しているプロダクトに影響する可能性があっても、インシデントがプロジェクトで使用されていないロケーションで発生していることがあります。 Google Cloud
- 影響なし: このインシデントはプロジェクトに影響していません。
- 不明: 現時点ではプロジェクトへの影響は不明です。