基于日志的提醒政策的突发事件

突发事件是关于满足提醒政策的条件的时刻的记录。通常,如果满足条件,Cloud Monitoring 会创建一个突发事件,并在收到符合基于日志的提醒政策条件的日志时发送通知。不过,在以下情况下,系统不会创建突发事件:

  • 政策已暂停或已停用。
  • 对于每个基于日志的提醒,通知频率上限会超过每 5 分钟 1 条通知的限制。
  • 对于每个基于日志的提醒,每日通知总数会超过每天 20 条通知的限制。

本文档介绍如何查看、调查和管理基于日志的提醒政策的突发事件。

准备工作

确保您拥有所需的权限:

如需详细了解 Cloud Monitoring 角色,请参阅使用 Identity and Access Management 控制访问权限

查找突发事件

如需查看突发事件列表,请执行以下操作:

  1. 在 Google Cloud 控制台的导航面板中,选择 Monitoring,然后选择  提醒

    进入提醒

    • 摘要窗格列出了未结突发事件的数量。
    • 突发事件窗格会显示最近的未结突发事件。如需在表格中列出最近的突发事件(包括已关闭的突发事件),请点击显示已关闭的突发事件
  2. 可选:如需查看特定突发事件的详细信息,请在列表中选择相应突发事件。系统会打开突发事件详情页面。如需了解本页面,请参阅本页面的调查突发事件部分。

查找较早的突发事件

提醒页面上的突发事件窗格显示最近未结的突发事件。要查找较早的突发事件,请执行以下任一操作:

  • 如需分页浏览突发事件表中的条目,请点击 较新 较早

  • 要导航到突发事件页面,请点击查看所有突发事件。在突发事件页面中,您可以执行以下操作:

    • 显示已关闭的突发事件:如需列出表中的所有突发事件,请点击显示已关闭的突发事件
    • 过滤突发事件:如需了解如何添加过滤条件,请参阅过滤突发事件
    • 确认或关闭突发事件,或延后其提醒政策。 如需访问这些选项,请点击突发事件所在行中的  更多选项,然后从菜单中进行选择。如需了解详情,请参阅管理突发事件

过滤事件

当您在过滤栏中输入值时,只有与过滤条件匹配的突发事件会列在突发事件表中。如果您添加了多个过滤条件,则只有在满足所有过滤条件的情况下,系统才会显示突发事件。

如需添加突发事件表的过滤条件,请执行以下操作:

  1. 突发事件页面上,点击  过滤表,然后选择过滤条件属性。过滤条件属性包括以下所有内容:

    • 突发事件的状态
    • 提醒政策的名称
    • 突发事件打开或关闭的时间
  2. 从二级菜单中选择一个值,或在过滤栏中输入一个值。

调查突发事件

找到要调查的突发事件后,请转到该事件的突发事件详情页面。如需查看详细信息,请在 Alerting 页面或 Incidents 页面的突发事件表格中选择突发事件摘要。

或者,如果您收到了包含突发事件链接的通知,则可以使用该链接查看突发事件详情。

突发事件详情页面提供以下信息:

  • 状态信息,包括:

    • 名称:触发此突发事件的提醒政策的名称。
    • 状态:突发事件的状态:未结、已确认或已关闭。
    • 严重程度:突发事件的严重程度:
      • 无严重级别
      • 严重
      • 错误
      • 警告
    • 持续时间:突发事件持续的时长。
  • 日志窗格,显示与提醒查询匹配的日志条目。在此窗格中,您可以在调查中过滤这些条目。

    如需刷新日志条目列表,请点击 刷新。如需在日志浏览器中查看日志,请点击  在日志浏览器中查看

  • 导致突发事件的提醒政策的相关信息:

    • 条件窗格:标识导致突发事件的提醒政策中的条件。对于使用日志浏览器创建的基于日志的提醒政策,条件名称始终为“日志匹配条件”。

      此窗格还会报告提醒政策之间的通知间隔和提醒政策自动关闭时长。

    • 消息窗格:基于提醒政策中的条件配置的简要原因说明。此窗格会始终填充内容。

    • 文档窗格:显示您在创建提醒政策时提供的通知的文档模板。此信息可能包括对提醒政策监控内容的说明,以及关于应对措施的提示。

      如果您在创建提醒政策时跳过了此字段,则此窗格会报告“未配置任何文档”。

  • 标签:报告以下内容:
    • 导致突发事件的日志条目中包含的受监控的资源的标签和值。此信息可帮助您识别导致突发事件的特定受监控资源。这些标签也在 Message 字符串中报告。
    • 您在提醒政策中定义的任何用户指定的标签和值。您可以使用这些标签来组织和识别提醒政策。与政策关联的标签列于政策标签部分,而条件中定义的标签列于指标标签部分。仅当存在依赖于该标签的过滤条件或分组时,才会显示元数据标签。如需了解详情,请参阅使用标签注释提醒

突发事件详情页面还提供用于调查突发事件的工具:

  • 其他问题排查工具的链接。项目和提醒政策的配置以及突发事件的持续时间决定了可用的链接。
    • 如需查看提醒政策的详情页面,请点击查看政策
    • 要修改提醒政策的定义,请点击修改政策
    • 如需在日志浏览器中查看相关日志条目,请点击查看日志。如需了解详情,请参阅使用日志浏览器查看日志
  • 注释:提供有关突发事件调查的发现、结果、建议或其他评论的日志。
    • 要添加注解,请在字段中输入文本,然后点击添加注解
    • 要舍弃评论,请点击取消

管理突发事件

突发事件具有以下状态之一:

  • 待解决: 已满足基于日志的提醒政策的条件,且突发事件仍处于未解决状态。如果再次满足相同条件且已有一个未解决的突发事件,则不会创建新突发事件。

  • 已确认:该突发事件为未结状态,并被标记为已确认。通常,此状态表示正在调查突发事件。

  • 已结束:您手动关闭了突发事件,或在自动关闭期限到期后自动关闭事件。

确认突发事件

我们建议您在开始调查突发事件的原因时将突发事件标记为已确认。

如需将突发事件标记为已确认,请执行以下操作:

  • 提醒页面的突发事件窗格中,点击查看所有突发事件
  • 突发事件页面上,找到要确认的突发事件,然后执行以下操作之一:

    • 点击  更多选项,然后选择确认
    • 打开突发事件的详细信息页面,然后点击确认突发事件

延后提醒政策

如需阻止 Monitoring 在特定时间段内创建突发事件和发送通知,请延后相关提醒政策。延后提醒政策时,与提醒政策相关的突发事件会保持未解决状态,但不会引发进一步的通知。突发事件根据提醒政策自动关闭时长关闭。

如需针对您正在查看的突发事件创建延后,请执行以下操作:

  1. 突发事件详情页面上,点击延后

  2. 选择延后时长。选择延后持续时间后,延后会立即开始。

查看突发事件的详情页面时,可以点击延后并选择时长,为相关提醒政策创建延后。延后会立即开始。您还可以在突发事件页面中延后提醒政策,方法是找到要延后的突发事件,点击  更多选项,然后选择延后。您可以在服务中断期间暂停提醒政策,以防止在问题排查过程中收到更多通知。

关闭突发事件

您可以让 Monitoring 为您结束突发事件,或者您自己结束突发事件。

当提醒政策的自动关闭期限到期后,Monitoring 会自动结束突发事件。默认情况下,自动关闭时长为 7 天。自动关闭时长下限为 30 分钟。

如需结束突发事件,请执行以下操作:

  1. 提醒页面的突发事件窗格中,点击查看所有突发事件
  2. 突发事件页面上,找到要结束的突发事件,然后执行以下操作之一:

    • 点击  查看更多,然后选择关闭突发事件
    • 打开突发事件的详情页面,然后点击结束突发事件
如果您看到 Unable to close incident 消息,请过几分钟后重试。您无法立即关闭新突发事件,因为提醒系统仍认为导致突发事件的条件仍为活跃状态。

数据保留和限制

如需了解限制和突发事件的保留期限,请参阅提醒限制

后续步骤