Cloud Monitoring によるアラート ポリシーのスヌーズ
Google Cloud Japan Team
※この投稿は米国時間 2022 年 8 月 12 日に、Google Cloud blog に投稿されたものの抄訳です。
開発チームには、営業時間外のアラートをスヌーズしたい、予定されているメンテナンス時間枠の間はアラートが作成されないように事前に設定したい、といったニーズがある場合があります。Google Cloud のオペレーション スイートの Cloud Alerting は、アラート ポリシーを一定期間スヌーズする機能をサポートするようになりました。特定のアラート ポリシーと期間を指定することで、スヌーズを作成できます。この時間枠内でアラート ポリシーに違反した場合、インシデントや通知は作成されません。時間枠が終了すると、通常どおりにアラートの動作が再開されます。
チームはこの機能をさまざまな方法で利用できます。一例としては、週末に本番環境以外のページングを回避できます。既知のメンテナンスの時間枠またはカットオーバー期間に備えるためにも使えます。また、サービス停止が広がっているときに、対応中のアラートの多発を止めるという利用方法もあります。
スヌーズを作成するには、[Monitoring] > [アラート] を選択します。「スヌーズ」という新しいテーブルが表示されるので、[スヌーズを作成] をクリックします。スヌーズの名前、期間を指定し、希望するアラート ポリシーを選択します。条件を選択すると、テーブルにその条件に一致する最近のインシデントが一覧表示されます。スヌーズがアクティブなときには、これらのイベントによってアラートが発生することはありません。
過去、現在、未来のスヌーズを可視化したタイムラインが表示されます。期間を調整したい場合は、戻って編集できます。詳細については、ドキュメントをご覧ください。
将来的にはこの機能を拡張し、ラベルによるスヌーズも可能にする予定です。リソース、システム、指標、カスタムラベルに基づいて一時的にアラートを停止できるようになり、特定の環境、ゾーン、またはチーム内のすべてのアラート ポリシーをスヌーズするという利用方法が実現します。この機能は API でサポートされるように拡張され、定期的に繰り返されるイベントに対してプログラマティックにスヌーズを作成できるようになる予定です。
- プロダクト マネージャー Alisa Goldstein