- 政策已延后或停用。
- 通知速率上限将超过每个基于日志的提醒政策每 5 分钟 1 条通知的限制。
- 通知的每日总数将超过每个基于日志的提醒政策每天 20 条通知的限制。
对于每项突发事件,Monitoring 都会创建一个突发事件详情页面,供您管理突发事件,并报告有助于您排查故障的突发事件信息。 例如,突发事件详情页面会显示日志条目列表 与基于日志的提醒政策查询匹配的过滤条件。您还可以找到指向相关事故的链接。
本文档介绍了如何查找突发事件。本页面还介绍了如何使用突发事件详情页面管理基于日志的提醒政策的突发事件。这些政策会评估 Cloud Logging 中各个日志中存储的日志条目数据。
准备工作
确保您拥有所需的权限:
如需获得使用 Google Cloud 控制台查看和管理突发事件所需的权限,请让管理员向您授予项目的以下 IAM 角色:
-
使用 Google Cloud 控制台查看突发事件:
-
Monitoring Cloud Console Incident Viewer (
roles/monitoring.cloudConsoleIncidentViewer
) -
Stackdriver Accounts Viewer (
roles/stackdriver.accounts.viewer
)
-
Monitoring Cloud Console Incident Viewer (
-
使用 Google Cloud 控制台管理突发事件:
-
Monitoring Cloud Console Incident Editor (
roles/monitoring.cloudConsoleIncidentEditor
) -
Stackdriver Accounts Viewer (
roles/stackdriver.accounts.viewer
)
-
Monitoring Cloud Console Incident Editor (
如需详细了解如何授予角色,请参阅管理对项目、文件夹和组织的访问权限。
如需详细了解 Cloud Monitoring 角色, 请参阅使用 Identity and Access Management 控制访问权限。
查找突发事件
如需查看 Google Cloud 项目中的突发事件列表,请执行以下操作:
-
在 Google Cloud 控制台中,转到 notifications 提醒页面:
如果您使用搜索栏查找此页面,请选择子标题为监控的结果。
- 摘要窗格列出了未结突发事件的数量。
- 突发事件窗格会显示最近的未结突发事件。如需在表格中列出最近的突发事件(包括已关闭的突发事件),请点击显示已关闭的突发事件。
如需查看特定事故的详细信息,请在列表中选择相应事故。
系统随即会打开突发事件详情页面。如需详细了解突发事件详情页面,请参阅本页的调查突发事件部分。
查找较早的突发事件
提醒页面上的突发事件窗格显示最近未结的突发事件。要查找较早的突发事件,请执行以下任一操作:
如需分页浏览突发事件表中的条目,请点击 arrow_back_ios 较新或 arrow_forward_ios 较早。
要导航到突发事件页面,请点击查看所有突发事件。在突发事件页面中,您可以执行以下操作:
过滤事件
当您在过滤栏中输入值时,只有与过滤条件匹配的突发事件会列在突发事件表中。如果您添加了多个过滤条件,则只有在满足所有过滤条件的情况下,系统才会显示突发事件。
如需添加突发事件表的过滤条件,请执行以下操作:
在突发事件页面上,点击 filter_list 过滤表,然后选择过滤条件属性。过滤条件属性包括以下所有内容:
- 突发事件的状态
- 提醒政策的名称
- 突发事件打开或关闭的时间
从二级菜单中选择一个值,或在过滤栏中输入一个值。
调查突发事件
突发事件详情页面包含的信息可能有助于您找出突发事件的原因。
浏览日志条目
浏览日志条目,找出与您的调查相关的模式和反复出现的问题。日志窗格会显示与您的查询匹配的日志条目 基于日志的提醒政策。
- 如需在日志浏览器中查看日志条目,请点击在日志浏览器中查看,然后选择一个范围限定项目。
- 如需在 Metrics Explorer 中查看日志面板,请点击 query_stats 探索数据。
查看补充信息
标签部分会显示导致相应事故的日志条目中包含的受监控资源的标签和值。此信息可帮助您识别导致突发事件的特定受监控资源。如需了解详情,请参阅使用标签为突发事件添加注释。
文档部分显示您在创建提醒政策时提供的通知的文档模板。这些信息可能包括对提醒 并提供缓解措施建议。如需了解详情,请参阅使用用户定义的文档为通知添加注释。
如果您未为提醒政策配置文档,则文档窗格会显示“未配置任何文档”。
探索相关突发事件
为了帮助您发现应用中的潜在问题,您可以 探索与其他提醒政策条件相关的突发事件。
相关突发事件部分会显示与以下任一条件匹配的突发事件列表:- 当满足同一提醒政策的条件时,系统会创建突发事件。
- 该突发事件与“突发事件详情”页面上显示的突发事件共用一个标签。
管理突发事件
突发事件具有以下状态之一:
error 打开: 满足了基于日志的提醒政策的条件,并且突发事件仍未结束。如果再次满足相同条件 已有未结突发事件,则未创建新突发事件。
warning已确认:该突发事件为未结状态,并被标记为已确认。通常,此状态表示正在调查突发事件。
check_circle 已结束:您手动关闭了突发事件,或在自动关闭期限到期后自动关闭事件。
确认突发事件
我们建议您在开始调查突发事件的原因时将突发事件标记为已确认。
如需将突发事件标记为已确认,请执行以下操作:
- 在提醒页面的突发事件窗格中,点击查看所有突发事件。
在突发事件页面上,找到要确认的突发事件,然后执行以下操作之一:
- 点击 more_vert 更多选项,然后选择确认。
- 打开突发事件的详细信息页面,然后点击确认突发事件。
延后提醒政策
如需阻止 Monitoring 在特定时间段内创建突发事件并发送通知,请暂停相关提醒政策。 暂停提醒政策后,与提醒政策相关的突发事件仍会保持未解决状态,但不会再发送通知。突发事件的关闭依据是 提醒政策自动关闭时长。
如需为您正在查看的突发事件创建提醒,请执行以下操作:
在突发事件详情页面上,点击延迟通知政策。
选择延后时长。选择延迟时长后,系统会立即开始延迟。
您还可以在突发事件页面上延迟提醒政策的提醒,具体方法是找到要延迟提醒的突发事件,点击 more_vert 更多选项,然后选择延迟。您可以在服务中断期间暂停提醒政策,以防进一步 通知。
关闭突发事件
您可以让 Monitoring 为您结束突发事件,或者您自己结束突发事件。
当提醒政策的自动关闭期限到期后,Monitoring 会自动结束突发事件。默认情况下,自动关闭时长为 7 天。自动关闭时长下限为 30 分钟。
如需结束突发事件,请执行以下操作:
- 在提醒页面的突发事件窗格中,点击查看所有突发事件。
在突发事件页面上,找到要结束的突发事件,然后执行以下操作之一:
- 点击 more_vert 查看更多,然后选择关闭突发事件。
- 打开相应突发事件的突发事件详情页面 然后点击关闭突发事件。
Unable to close incident
消息,请过几分钟后重试。您无法立即关闭新突发事件,因为
提醒系统仍然将其视为活跃状态。
数据保留和限制
如需了解限制和突发事件保留期限, 请参阅提醒限制。
后续步骤
- 要使用 Cloud Logging API 或 请参阅使用 API 管理提醒政策。