Personalized Service Health 概览

本文档简要介绍了 Personalized Service Health,该工具可让您 Google Cloud 识别与您的项目相关的服务中断情况,以便您高效地管理和应对它们。这些中断称为服务运行状况事件,可在 Google Cloud 控制台和各种集成点查看。

Personalized Service Health 的运作方式

下图展示了 Personalized Service Health 如何提供服务运行状况事件。

Personalized Service Health

您可以通过以下方式访问服务运行状况事件:

  • Service Health 信息中心:跟踪与您的项目相关的新兴活跃 Google Cloud 突发事件
  • Service Health API:拉取每个项目或组织的服务运行状况事件信息。
  • 提醒:接收与您的项目相关的事件的通知。提醒基于 Cloud Logging 中的日志。
  • 日志:导出与 Google Cloud 事件相关的日志。

在 Service Health 信息中心内查看当前和过往的 Google Cloud 服务中断事件

Google Cloud 控制台中的 Service Health 信息中心会显示与您的项目相关的服务中断情况、其状态以及受影响的Google Cloud 产品和位置。

如需了解如何访问服务运行状况信息中心,请参阅快速入门

在移动设备上 Google Cloud 查看事故和接收提醒

您还可以在移动设备上查看服务运行状况信息中心。

如需在移动设备上接收提醒,您可以配置提醒政策,以将提醒发送到移动设备。

使用 Service Health API 请求服务运行状况事件

借助 Service Health API,您可以获取可能正在影响或已影响您项目的服务运行状况事件,或者获取更新、开始/结束时间、受影响的产品和位置以及状态等事件详情。 Google Cloud

如需了解详情,请参阅 Service Health API 参考文档

通过 Cloud Logging 配置提醒或导出日志

Personalized Service Health 会在 Cloud Logging 中记录服务运行状况事件,并让您可以根据这些日志设置提醒。您可以针对以下情况设置提醒:报告新的服务中断情况、更新现有服务中断情况,或者创建或更新特定 Google Cloud 产品或地理位置的服务中断情况。

如需在服务运行状况信息中心内设置提醒,请参阅快速入门

概念

Personalized Service Health 使用以下概念来表示影响您的项目的事件,以及这些事件与您的项目之间的关联方式。

服务运行状况事件

服务运行状况事件 (v1v1beta) 是指影响与您的项目或资源相关的 Google Cloud 产品的任何中断性事件。示例包括网络中断、配置错误和性能问题。

每项事件都包含有关事件整体影响的详细信息、Google 的最新动态,以及与您的 Google Cloud 项目相关的信息。

突发事件

突发事件是指与您的项目相关的正在发生且处于活跃状态的 Google Cloud 服务中断或服务降级。这是服务运行状况事件的一种类别。

突发事件包括以下内容:

  • 突发事件影响:事件范围的详细信息,例如受影响的Google Cloud 产品和位置。
  • Google Cloud动态:Google Cloud 支持团队的定期动态。
  • 个性化相关性:突发事件与您的 Google Cloud项目的相关性。
  • 症状、权宜解决方法和预计解决时间:有助于评估影响、应用权宜解决方法或详细了解根本原因的信息。

突发事件可能包含突发事件报告,其中包含导致突发事件的因素,以及 Google Cloud 计划采取的措施来防止类似突发事件再次发生。突发事件报告适用于符合以下条件的突发事件:

  • 突发事件具有全球影响,或者影响一个或多个地区中大量客户的项目。
  • 有一个或多个商品不可用或严重降级。

事件状态和详细状态

事件有两个字段用于指示其状态。这些字段的值会随着事件的发展而变化。

  • 事件状态:表示事件的整体状态。可以是下列选项之一:

    • 有效:事件正在积极影响 Google Cloud ,并将继续接收更新。
    • 已关闭:事件不再影响任何 Google Cloud 产品,或已与其他事件合并。
  • 详细状态:提供有关事件状态的更多信息。 此字段仅适用于突发事件,并且可以是以下值之一,具体取决于事件状态:

    • 新出现:Google 工程师正在积极调查此问题,以确定影响。影响评估完成后,新出现的突发事件将变为已确认或已解决的突发事件。正在处理的突发事件可能是新出现的突发事件。

      仅支持对新出现的网络事件提供支持 Google Cloud。

    • 已确认:Google 工程师已确认突发事件,并且至少会影响一个 Google Cloud 产品。在问题得到解决之前,我们会持续提供状态更新。

      有效的突发事件可以是已确认的突发事件。

    • 已合并:突发事件已合并到父级突发事件。所有后续更新都将仅发布到父级账号。

    • 已解决:采取措施后,突发事件不再影响任何 Google Cloud产品。我们不会再提供后续更新。

      已关闭的突发事件通常是指已解决的突发事件。

    • 假正例:经过调查,Google 工程师得出结论,此问题不会影响 Google Cloud 产品。如果再次审核突发事件,此状态可能会发生变化。

    • 自动关闭:突发事件因以下原因而自动关闭:

      • 我们无法确认该事件的影响。
      • 突发事件是间歇性突发事件或自行解决。

      由于未执行任何操作或调查,因此该突发事件未得到解决。如果问题是间歇性问题,我们可能会重新打开突发事件。

相关性

Personalized Service Health 会评估所有突发事件对您的项目的影响。如果服务中断可能或确实会影响您的项目,则 Service Health 信息中心和 API 中会显示相应信息。

相关性描述了突发事件对您的项目有何影响。相关性可能会随着突发事件的进展而变化。

相关性可以具有以下值:

  • 受影响:经确认,该事件影响了您的项目。 仅适用于部分 Google Cloud 商品
  • 相关:突发事件与您的项目直接相关,并影响您的项目所用位置的 Google Cloud 产品。
  • 部分相关:此突发事件与您的项目使用的 Google Cloud产品相关联,但可能不会影响您的项目。例如,此突发事件可能影响到您的项目所使用的 Google Cloud 产品,但您的项目并未使用受影响的位置。 Google Cloud
  • 未受影响:突发事件没有影响您的项目。
  • 未知:目前无法了解对您的项目的影响。