アラートの概要

このセクションでは、Google Distributed Cloud(GDC)エアギャップ アプライアンスで使用可能なアラート機能について説明します。

アラートは、GDC で問題をタイムリーに認識し、問題をすばやく解決できるようにするオブザーバビリティ サービスです。アラート ポリシーには、アラートを受け取る状況と通知の受信方法を記述します。

指標ベースのアラート ポリシーは、収集されたシステム モニタリング データを追跡し、リソースが事前に設定された条件を満たしたときに特定の人に通知します。たとえば、仮想マシン(VM)の CPU 使用率をモニタリングするアラート ポリシーがトリガーされると、このポリシーによりオンコール チームに通知されることがあります。または、稼働時間チェックをモニタリングするポリシーにより、オンコール チームと開発チームに通知されることがあります。

一定期間内のログの繰り返しイベントをモニタリングするには、ログベースの指標を使用してアラート ポリシーを作成します。ログベースの指標は、システム ロギング データから数値データを生成します。ログベースの指標は、次のいずれかを行う場合に適しています。

  • ログ内で警告やエラーなどのメッセージの発生回数をカウントします。また、イベント数がしきい値を超えた場合に通知を受け取ります。
  • ログのレイテンシ値といったデータの傾向を監視する。値が許容できないほど変化した場合に通知を受け取る。
  • ログから抽出した数値データをグラフにして表示する。

GDC のオブザーバビリティ プラットフォームは、受信したアラートを収集し、データ オブザーバビリティの構成とワークフロー ルールに基づいてユーザー通知を送信します。GDC では、アラートによって重大なエラーのページとチケットが生成されることがあります。ページはオペレーターによる早急な対応が必要ですが、チケットは緊急性が低いものです。