使用微服务信息中心

本页面介绍了如何查看和使用与服务关联的信息中心。

项目中的每项服务都有自己的信息中心。通过信息中心,您可以观察服务的各个方面及其执行方式,包括日志、性能指标和提醒政策状态。

您可以按如下方式打开服务的信息中心:

  • 对于现有服务,请在服务概览页面的商品目录表中点击该服务的名称。如需了解详情,请参阅查看微服务

  • 成功定义新的自定义服务后,点击查看服务信息中心。如需了解详情,请参阅定义服务

信息中心结构

Cloud Monitoring 中每个服务的信息中心具有相同的基本结构。

  • 所有服务类型的信息中心都包含以下内容:

    • 服务详情:提供服务的识别信息。
    • 提醒信息:说明提醒政策的实施方式。
    • 当前 SLO 状态:描述您的服务在实现服务等级目标 (SLO) 方面的表现。
    • Logging 信息:在 Cloud Logging 中显示此服务的近期日志条目。
  • 对于基于 GKE 的服务,信息中心还包括以下内容:

    • 指标:显示与服务相关的一组指标的图表。
    • 实体详情:列出了服务所基于的 GKE 实体的相关信息。

服务详情

服务详情窗格会显示与服务关联的 ID、类型和标签。以下屏幕截图显示了 App Engine 服务的示例:

**服务详情**显示可识别服务的信息。

提醒时间轴

提醒时间轴窗格显示最近触发的任何基于 SLO 的提醒政策的历史记录。当提醒政策触发时,它会引发突发事件。以下屏幕截图显示了通过触发前一天的提醒引发的事件:

**提醒时间轴**显示最近基于 SLO 的提醒。

彩色频段显示事件的持续时间。如需了解突发事件的更多信息,请将鼠标悬停在彩色频段上。系统会显示一个卡片,用于标识提醒政策,指示提醒政策触发的时间,并显示突发事件的当前状态。点击卡片上的提醒详情会转到 Cloud Monitoring 中的突发事件详情页面。如需在此页面上了解详细信息,请参阅突发事件

默认显示时间段为一小时。要更改显示时间段,请在时间范围选择器中选择其他值。

要从显示中移除提醒时间轴,请点击 隐藏时间轴

当前 SLO 状态

当前状态窗格会显示为服务定义的每个 SLO 的状态。以下屏幕截图显示了具有两个 SLO 的服务的当前状态:

**当前状态**显示 SLO 的性能。

每个 SLO 都会在表中显示为一行并包含以下列:

  • 状态指示服务是否满足 SLO。
  • 目标简要介绍了 SLO 的性能目标。
  • 类型描述了 SLO 中使用的服务等级指标 (SLI)。
  • 提醒触发显示的是触发提醒政策的次数与提醒政策总数的比率。
  • 错误预算显示剩余的错误预算所占的百分比。
  • 更多选项显示可对服务进行的配置更改,例如创建提醒政策。
  • 显示更多可展开当前行,以显示 SLO 性能的更多详细信息。

当前状态窗格还包含创建 SLO 按钮。一个服务可以有多个 SLO。如需了解如何创建 SLO,请参阅创建 SLO

状态详细信息

点击 显示更多可展开状态行,以显示有关 SLO 的更多详情:

当前 SLO 状态的详细信息标签包含一个图表。

在您点击 显示更多后,原始条目将被替换为显示 SLO 状态的彩色栏。该栏包含 SLO 的显示名称和类型,以及用于更改或删除 SLO 配置的修改删除按钮。

要返回状态摘要视图,请点击 收起

展开后的详细信息还包含以下内容的状态指标:

  • 服务等级指标的当前值。
  • 剩余错误预算的状态和值。
  • 此 SLO 的任何提醒政策的状态。

这些指标是标签,选择每个标签会更改详细信息显示的其余部分。默认情况下,系统会选择服务等级指标标签,参照 SLO 阈值,显示 SLI 在一段时间内的性能图表。上一个屏幕截图包含该图表。

“错误预算”标签

点击错误预算标签页,查看错误预算在一段时间内的消耗情况图表。

错误预算的“详情”标签包含一个图表。

对于 SLI 不满足 SLO 性能阈值的每个合规期,都会消耗一些错误预算。具体细节取决于 SLO 类型以及合规期;如需了解详情,请参阅错误预算错误预算的趋势

当合规期的错误预算耗尽时,您的服务将无法满足 SLO。

提醒标签

点击提醒触发标签,查看未结突发事件数量和提醒政策状态,并定义其他提醒政策:

触发提醒的详细信息标签汇总了政策。

点击查看政策可转到与此 SLO 关联的提醒政策的政策详情页面。

政策详情总结了与政策相关的所有信息。

政策详情显示的图表显示了服务耗用其错误预算的速率。创建提醒政策时,您需要根据错误预算的大小和合规期长度设置阈值。阈值预计是:在合规期结束前,错误预算未耗尽情况下的消耗速率,并且提醒政策会在您超过该速率时发出警告。

如需详细了解这些提醒政策的运行方式,请参阅消耗率提醒;如需了解如何创建提醒政策,请参阅创建提醒政策

日志

日志窗格显示此服务写入 Cloud Logging 的日志条目。以下屏幕截图展示了一个示例:

**日志**显示此服务写入的 Cloud Logging 日志条目。

要分析日志条目,请点击 Cloud Logging 中的在日志浏览器中打开。如需了解详情,请参阅使用日志浏览器查看日志

指标

仅适用于基于 GKE 的服务。

指标窗格显示由服务写入的指标选择图表。可用指标集取决于服务代表的实体类型。以下屏幕截图显示了基于 Kubernetes 集群的服务默认图表:

**指标**显示所选服务指标的图表。

每个图表都有一个工具栏,包含以下按钮:

  • Legend Toggle 在图表下方显示图例。 如需了解图表图例,请参阅配置图例
  • 全屏在全屏模式下显示图表。
  • 更多选项会显示一个包含以下选项的菜单:
    • 下载 PNG 会以 PNG 格式保存图表的图片。
    • 在 Metrics Explorer 中查看:在 Metrics Explorer 中打开图表,您可以在其中更改图表显示的数据和图表的显示特征。如需了解详情,请参阅 Metrics Explorer

如需了解 Monitoring 图表的一般信息,请参阅添加信息中心微件

其他图表

对于集群,指标面板默认显示集群中 CPU 消耗的图表。您可以从指标菜单中选择一组不同的指标,以查看另一组图表。以下屏幕截图显示了基于集群的服务菜单:

其他图表将显示在**指标**窗格中。

此菜单显示此服务可用的指标类别:容器、Pod 和网络。其中每个类别都包含许多指标类型,且此窗格中提供了图表。

示例服务的指标 格最初会显示容器的 CPU 消耗图表,但也有显示容器的临时存储、内存和其他指标的图表。此外,您还可以查看 Pod 和节点指标的图表。

点击 帮助,详细了解图表中可用的指标。此菜单中的图表选项与 Kubernetes 指标列表中的指标类型相对应。

实体详细信息

仅适用于基于 GKE 的服务。

Kubernetes 实体详情窗格显示与此服务关联的 GKE 实体的相关信息。显示的信息取决于服务代表的实体类型。以下屏幕截图显示了基于 Kubernetes 集群的服务中的一些实体:

**Kubernetes 实体详情**显示有关服务中实体的信息。

表中的每一行还有一个 更多选项按钮,提供通过菜单查看实体相关信息的其他方式:

  • 查看 Google Kubernetes Engine 信息中心。如需详细了解此信息中心,请参阅 Google Kubernetes Engine 文档中的 GKE 信息中心
  • 在日志浏览器中查看此服务写入的日志条目。如需了解详情,请参阅使用日志浏览器查看日志