查看和管理指标使用情况

本文档介绍了 Cloud Monitoring 指标管理页面,该页面提供的信息可帮助您控制可计费指标的支出金额,而不会影响可观测性。您可以使用指标管理页面执行以下操作:

  • 确定您正在项目中主动收集的计费指标。
  • 确定哪些项目发送的数据最多。
  • 了解与您的 Google Cloud 项目中使用的可计费指标相关的费用。
  • 设置提醒,以便在使用模式发生变化时收到通知。您可以针对指标数据的整体提取情况以及任何指标的行为设置提醒。
  • 查看自定义信息中心和提醒政策中可计费指标的使用情况。如果您不在任何信息中心或提醒政策中使用某个指标,该指标在可观测性方面没有任何优势。
  • 为没有关联提醒政策或信息中心的指标创建图表和提醒政策。
  • 找出可计费指标的基数可能存在的问题。
  • 排查写入指标数据时遇到的错误。
  • 查看与收集计费指标相关的审核日志。 如需了解审核日志的一般信息,请参阅 Cloud Audit Logs 概览

指标管理页面会显示 Google Cloud 项目有权访问的计费指标的相关信息。您的 Google Cloud 项目可以访问其指标范围内可见的所有指标。

指标管理页面还提供指向当前 Google Cloud 项目中定义的提醒政策和自定义信息中心的链接。如需查看指标范围内但在其他项目中定义的指标的提醒政策或自定义信息中心,请使用项目选择器选择存储该指标的 Google Cloud 项目。

您还可以在 Metrics Management 页面中,查看与指标中的错误相关的审核日志。这些日志可以帮助您确定错误的原因。

可计费指标的定价模式

一般来说,Cloud Monitoring 系统指标是免费的,来自外部系统或应用的指标不是免费的。收费指标按注入的字节数或提取的样本数收费。本部分介绍了基于字节和样本的注入。

如需详细了解 Cloud Monitoring 中的收费功能,请参阅价格文档中的 Cloud Monitoring。如需了解价格信息,请参阅 Cloud Monitoring 价格摘要

按注入的字节数或样本数计费

收费指标按注入的字节数或提取的样本数收费。每次写入指标时,写入操作都会包含一个数据值。数据值可以是标量(例如整数或浮点数),也可以是分布(一种包含多个不同值的复杂数据类型)。如需详细了解指标可能写入的值类型,请参阅值类型

指标的写入频率(采样率)和指标写入的数据类型(标量或分布)都会影响提取的数据量,无论提取量是按注入的字节数还是按注入的样本收费。

  • “注入的字节数”表示根据注入的数据量(以字节为单位)收费。为了便于定价,每个标量值计为 8 个字节,每次分布计为 80 个字节。如需了解详情并查看示例,请参阅按注入的字节数收费的指标

  • “注入的样本数”是指根据注入的测量结果数量收费。为了便于定价,每个标量值都计为一个样本,每次分配计为两个样本,并针对每个计数非零的直方图分桶计为 1 个样本。如需了解详情和示例,请参阅按注入的样本数收费的指标

这两种定价模式的最大区别在于分布值。基于字节的提取按固定费率对分布收费,但基于样本的提取会考虑分布中的数据;具有稀疏直方图的分布(少数具有非零值的直方图分区)的样本数少于具有密集直方图的分布,而密集直方图中的大多数分区具有非零值。

指标管理页面上的可计费指标

指标管理页面会按网域报告可计费指标。通过网域,您可以了解指标的收集方式和来源。

下表介绍了指标管理页面上提供的计费指标的类别,以及它们是按注入的字节数还是按注入的样本数进行衡量:

网域 指标前缀 价格模式 含义
代理 agent.googleapis.com 字节 代理从外部资源收集的指标。如需查看这些指标的列表,请参阅 Ops Agent 指标以及旧版 Monitoring 和 Logging 指标。旧版 Monitoring 代理收集的来自第三方集成的指标也报告为“代理”指标;请参阅第三方应用指标

agent.googleapis.com/processes/”指标的计费方式是其他收费指标的 5%。 例如,注入 100 MiB 的进程指标的费用与提取 5 MiB 的其他付费指标的费用相同。

这些代理还会收集关于自己的指标。这些指标(以前缀 agent.googleapis.com/agent 标识)不计费,不会显示在指标管理页面上。

用户定义的自定义 custom.googleapis.com 字节 您定义的指标。
外部 external.googleapis.com 字节 来自某些开源库或第三方提供商的指标。如需了解详情,请参阅外部指标
工作负载 workload.googleapis.com 字节 Ops Agent 写入的第三方集成的指标。如需查看这些指标的列表,请参阅第三方应用指标
Prometheus prometheus.googleapis.com 示例 使用 Google Cloud Managed Service for Prometheus 或者使用 Ops Agent 和 Prometheus 接收器OTLP 接收器收集的指标。

其他可计费指标

指标管理页面不会报告以下类别的可计费指标:

  • 用户定义的基于日志的指标。这些指标是通过统计日志条目中的值派生而来,其前缀为 logging.googleapis.com/user。用户定义的基于日志的指标按注入的字节数收费。
  • 使用 AWS 连接器项目收集的 AWS CloudWatch 指标。这些指标的前缀为 aws.googleapis.com,按注入的字节数收费。

准备工作

如需查看 Metrics Management 页面中包含的图表和日志,并创建提醒政策,您必须获得正确的授权

授权

  • 如需获取使用 Google Cloud 控制台查看信息中心和创建提醒政策所需的权限,请让管理员向您授予项目的 Monitoring Editor (roles/monitoring.editor) IAM 角色。如需详细了解如何授予角色,请参阅管理访问权限

    您也可以通过自定义角色或其他预定义角色来获取所需的权限。

  • 如需获取查看审核日志所需的权限,请让管理员向您授予项目的 Private Logs Viewer (roles/logging.privateLogViewer) IAM 角色。如需详细了解如何授予角色,请参阅管理访问权限

    您也可以通过自定义角色或其他预定义角色来获取所需的权限。

    如需详细了解角色,请参阅使用 Identity and Access Management 控制访问权限

  • 启用审核日志记录后,您可以在指标管理页面上查看由这些指标生成的审核日志。如需将项目配置为在读取或写入数据时生成审核日志,请执行以下操作:

    1. 在 Google Cloud 控制台中,前往审核日志页面:

      前往审核日志

      如果您使用搜索栏查找此页面,请选择子标题为 IAM 和管理的结果。

    2. 在过滤栏上输入 Stackdriver Monitoring API
    3. 选择 Stackdriver Monitoring API
    4. 日志类型标签页中,选择数据写入数据读取,然后点击保存

    如需了解详情,请参阅配置数据访问审核日志

查看有关指标范围的信息

指标管理页面中显示的指标集取决于项目的指标范围。如果您的项目只有其自身的指标范围,则指标管理页面上的指标来自当前项目。如果您的项目在其指标范围内有多个项目,则指标管理页面上显示的指标包括所有这些项目的指标。对费用影响最大的指标可能来自其他项目。

如需查看项目范围信息的摘要,请点击指标范围。此摘要包含以下内容:

  • 有权访问项目的 IAM 主账号。主账号集包括用户、群组和服务帐号。
  • 对指标范围可见的免费指标和可计费指标的数量。
  • 当前项目所监控的项目的列表。您可以在指标管理页面上找到所有这些项目的可计费指标。
  • 有关可查看当前项目指标的任何项目的信息。

如需详细了解指标范围,请参阅配置多项目视图

调查可计费指标

指标管理页面提供了一个表格,其中包含指标范围内的每个可计费指标。您可以使用此表执行以下操作:

  • 按同一类别对计费指标进行过滤。 通过查看指标类别,您可能会发现在查看表中所有指标时难以检测出的模式。
  • 确定任何指标对可结算量的贡献。
  • 确定已收集但未在任何提醒政策或信息中心内使用的指标。不使用的指标数据可能代表可观测性存在缺口,或者是有机会节省费用。
  • 为没有关联提醒政策或自定义信息中心的指标创建提醒政策或图表。
  • 确定生成指标数据的项目。该表格包含指标范围内所有项目的指标,您可能需要从项目中了解收集了特定指标。
  • 查看有关每个指标的标签和基数信息。在您调查指标设计或使用问题时,这些信息会很有帮助。

如需查看每个计费指标的使用情况数据表,请执行以下操作:

  1. 在 Google Cloud 控制台中,转到 指标管理页面:

    进入指标管理

    如果您使用搜索栏查找此页面,请选择子标题为监控的结果。

  2. 在工具栏中,选择时间窗口。默认情况下,指标管理页面显示有关前一天收集的指标的信息。以下屏幕截图显示了指标表格的一个示例:

    指标表格会显示指标范围内项目中各个指标的相关信息。

选择要查看的指标

如需管理费用,您需要了解哪些可计费指标产生的流量最多。例如,仅知道每小时注入 60 MiB 的数据是不够的。但是,如果您知道大多数可计费数据是由一两个指标导致的,则可以调查这些指标的使用情况。

如需列出您的可计费指标,请执行以下操作:

  1. 在 Google Cloud 控制台中,转到 指标管理页面:

    进入指标管理

    如果您使用搜索栏查找此页面,请选择子标题为监控的结果。

  2. 在工具栏中,选择时间窗口。默认情况下,此标签页显示有关前一天收集的指标的信息。
  3. 如需仅显示特定的指标组,请使用快速过滤条件直接过滤表格

指标表列出了当前 Google Cloud 项目指标范围内的计费指标。对于每个指标,该表都会显示该指标对计费量的贡献,并提供指向与该指标关联的提醒政策和自定义信息中心的链接,如以下屏幕截图所示。如果没有与指标关联的提醒政策或信息中心,则表包含一个按钮,您可以点击该按钮创建一个。

指标表格会显示指标范围内项目中各个指标的相关信息。

如需按指标对可计费量的贡献度对其进行排序,请点击计费字节数/总计样本计费量/总计列标题。

指标表还会显示指标的网域、指标的标签集、提取指标的项目,以及指标的基数。以下屏幕截图显示了这些列的示例。

指标表会报告指标范围内指标的指标网域、标签、项目 ID 和基数。

标签和基数信息可能有助于确定可结算量增加的原因。在 Cloud Monitoring 中,基数是指与指标和资源关联的时序的数量,与标签及其值相关;每个标签值组合有一个时序。如需了解详情,请参阅基数

计费量的变化意味着您需要提取更多数据,如果变化是突然或意外的,则原因可能是与指标关联的标签数量发生变化,或标签值的设置方式发生变化。这两种方式都可以增加指标的基数,从而导致可计费量增加。如需了解如何使用 Metrics Management 来帮助识别指标问题,请参阅调查指标问题

使用快速过滤器

如需仅查看以下组中的指标,请在快速过滤条件窗格中选择一个条目:

  • 活跃和非活跃指标:过去 25 小时内写入或未写入时间序列数据的指标。
  • 当前 Google Cloud 项目的提醒政策中使用或未使用的指标。
  • 当前 Google Cloud 项目的自定义信息中心内使用或未使用的指标。这些过滤条件不包含在 Cloud Monitoring 提供的预定义信息中心内使用的指标。
  • 指标类别,如计费指标摘要中所述。

您可以使用过滤条件窗格按可过滤的特征选择指标。

例如,如果您的指标未用在提醒政策或自定义信息中心内,那么您可能需要为指标付费,而无法从这些指标中获益。通过选择无提醒政策无自定义信息中心快速过滤条件,您可以列出没有提醒政策或当前 Google Cloud 项目未定义的任何自定义信息中心内的指标。

直接过滤表格

如果没有合适的快速过滤器,您可以使用  过滤条件栏搜索一组指标。例如,如果您有一个多项目指标范围,并且只想列出该项目中的指标,则无法使用快速过滤条件。如需仅列出特定项目中的指标,请从过滤条件列表中选择 Project,然后输入项目的标识符。

您还可以使用显式过滤条件来搜索与过滤条件组合匹配的指标。您一次只能选择一个快速过滤条件,因此您不能使用快速过滤条件仅列出既未出现在提醒政策或自定义信息中心内的有效指标。如需搜索符合一组要求的指标,请向过滤栏添加过滤条件。例如,如需列出未显示在提醒政策和自定义信息中心内的活动指标,请将以下过滤条件添加到过滤栏中:

  • Status: Active
  • Alert Policies: (Empty)
  • Custom Dashboards: (Empty)

默认情况下,如果您添加多个过滤条件,当该行符合所有过滤条件时,该表格就会包含相应行。不过,您可以在两个其他过滤器元素之间插入一个 OR 过滤器。

为不受监控的指标创建提醒政策

如果表中的指标没有关联的提醒政策,表会显示一个创建提醒按钮。如需为指标创建提醒政策,请点击指标所在行中的创建提醒

提醒政策对话框随即打开,其中已填充条件字段。 建议您查看所有设置并做出以下修改:

  • 更新条件阈值。默认值可能不符合要求。
  • 将通知渠道添加到政策中。
  • 为政策命名。

您还可以为任何指标创建提醒政策,方法是点击  操作,然后点击为指标创建提醒

如需了解详情,请参阅创建提醒政策

为无监控的指标创建图表

如果表中的指标没有关联的自定义信息中心,则该表会显示一个创建图表按钮。您可以使用此按钮创建图表并将其放置在自定义信息中心内。如需为指标创建图表,请执行以下操作:

  1. 在指标对应的行中,点击创建图表

    分层图表面板随即会打开,并已预先配置为显示所选指标。您可以修改图表配置。 如需详细了解如何使用 Metrics Explorer,请参阅使用 Metrics Explorer 创建图表

  2. 若要将图表保存到自定义信息中心,请点击保存到信息中心

  3. Save Chart 面板上,执行以下操作:

    1. 接受或修改图表的默认标题。
    2. 选择要将图表保存到的现有自定义信息中心,或选择新建信息中心为图表创建一个新的信息中心。
    3. 点击保存图表

使用指标

虽然您可以使用 Metrics Management 页面查看有关指标的一些信息,但您可能希望获得更多信息。例如,您可能想要查看特定指标的图表,或者创建提醒政策,以便在该指标的提取率意外时通知您。

如需获取有关特定指标的更多详细信息,请执行以下操作:

  1. 在 Google Cloud 控制台中,转到 指标管理页面:

    进入指标管理

    如果您使用搜索栏查找此页面,请选择子标题为监控的结果。

  2. 在表格中找到该指标,然后点击  操作以执行以下任一操作:

    • 如需查看显示当前指标的图表,请选择在 Metrics Explorer 中查看

      Metrics Explorer 将会打开并预先配置为显示所选指标。您可以修改图表配置、舍弃配置,也可以将其添加到自定义信息中心。

    • 如需创建用于监控指标的提醒政策,请选择为指标创建提醒

      提醒政策对话框随即打开,其中已填充条件字段。 建议您查看所有设置并做出以下修改:

      • 更新条件阈值。默认值可能不符合要求。
      • 将通知渠道添加到政策中。
      • 为政策命名。

      如需了解详情,请参阅创建提醒政策

    • 如需查看与指标关联的审核日志,请选择查看指标审核日志

查看计费指标的注入量并发出提醒

大部分费用取决于注入的计费字节数和计费样本数。如需预测因使用可计费指标而产生的每月费用,您需要了解数据注入速率。指标管理页面会提供指标使用情况摘要,可帮助您执行以下操作:

  • 查看可计费指标的使用趋势。
  • 确定指标范围内的项目发送的指标数据数量是多于还是少于预期。
  • 确定生成最多数据的指标。
  • 确定负责生成最多 Prometheus 数据的命名空间。
  • 查看指标中的写入错误率。错误率是指返回错误状态的指标写入次数占指标写入总次数的百分比。

查看指标使用情况摘要

如需查看计费指标数量、指标提取率和错误率的摘要,请执行以下操作:

  1. 在 Google Cloud 控制台中,转到 指标管理页面:

    进入指标管理

    如果您使用搜索栏查找此页面,请选择子标题为监控的结果。

  2. 在工具栏中,选择时间窗口。默认情况下,指标管理页面显示有关前一天收集的指标的信息。以下屏幕截图展示了一个示例:

    摘要窗格会显示指标范围内各个项目的指标使用情况。

    • 如需简要了解指标范围内的项目中当前活跃的计费指标数量,请参阅活跃指标统计信息摘要。如果指标在过去 25 小时内写入,则该指标处于活跃状态。

    • 如需确定您的费用是由哪些因素构成的,请使用注入的计费字节数注入的计费样本数统计信息摘要。如需了解详情,请参阅查看指标提取的总体趋势

    • 如需查找可能有助于识别计费指标设计或使用问题的信息,请使用指标写入错误统计信息摘要。如需了解详情,请参阅调查指标问题

指标管理页面显示您要提取的数据量,而非实际费用。如需查看当前的结算信息,请点击工具栏中的查看结算信息

查看指标提取的总体趋势

如需确定应用生成的数据量是否一致(这是稳定应用的预期行为),请使用注入统计信息摘要查看收集速率。如果您更改查看指标的时间窗口,则可能会看到低谷、峰值或趋势。

如需查看一段时间内的收集速率,请执行以下操作:

  1. 在 Google Cloud 控制台中,转到 指标管理页面:

    进入指标管理

    如果您使用搜索栏查找此页面,请选择子标题为监控的结果。

  2. 在工具栏中,选择您的时间范围。
  3. 对于注入的字节或样本,在统计信息摘要中点击查看图表。 这里讨论的是可计费样本的图表,但计费字节数的图表的工作原理相同。您会看到一组如下所示的图表:

    汇总指标提取情况的图表示例。

    默认情况下,图表图例处于收起状态。如需查看图表中显示的时序列表,请点击  图例。如需了解如何设置时间参考或在特定时间范围内展开图表,请参阅探索已绘制成图表的数据

例如,如果您将时间范围设置为一周,并且看到提取的数据随时间而意外增加,则您可能需要查看该增加是来自特定指标,还是一组指标的一般趋势。如果某个指标具有响应性,则可以进行调查,看看该指标的基数是否也在增加。

  • 如需查看注入当前指标范围的计费样本的比率,请使用注入的计费样本总数图表。

  • 如需查看指标范围内每个项目对总计费值的贡献,请使用按注入的计费样本数划分的项目图表。通过此图表,您可以了解哪些项目发送的数据最多,以及是否有项目发送的数据量在增减。

  • 仅限计费样本)如需查找发送的指标对计费值影响最大的命名空间,请使用命名空间卷提取图表。

  • 如需查看您的指标范围内对计费值影响最大的指标,请使用注入的计费样本数的前 10 个指标图表。您可能需要查找收集率的高峰、低谷或趋势,或者查看指标是否存在与其他指标完全不同的指标。

  • 如需查看对指标范围内所有指标的计费值的贡献,请使用所有指标(按注入的计费样本数)图表。此图表包含前 10 个图表中的指标,可向您展示指标的收集率的总体分布情况。

如需更详细地分析其中任何图表,请点击  更多选项,然后选择在 Metrics Explorer 中查看。如需查看以命名空间卷提取图表开头并使用 Metrics Explorer 执行提取量归因的示例,请参阅以下内容:

如需详细了解如何使用 Metrics Explorer 分析数据(包括比较当月行为与上个月的行为等操作),请参阅探索已绘制成图表的数据

根据指标注入情况创建提醒

如需在可计费指标的指标收集率出现激增、骤降或趋势时收到通知,请创建提醒政策。例如,指标集合的下降可能表示您的应用性能不佳。同样,峰值也可能会导致意外收费。最后,上升趋势可能表示指标的标签过多或基数在增加。在所有情况下,提醒政策都能告知您异常行为,以便您解决问题。

如果您既有按注入的字节数计费的指标,又按注入的样本数计费的指标,则需要为这两个结算值创建提醒政策。

如需创建用于监控指标收集速率的提醒政策,请执行以下操作:

  1. 在 Google Cloud 控制台中,转到 指标管理页面:

    进入指标管理

    如果您使用搜索栏查找此页面,请选择子标题为监控的结果。

  2. 在工具栏中,选择您的时间范围。
  3. 在针对注入的字节或样本的统计信息摘要中点击查看图表
  4. 在要监控其数据的图表中,点击创建提醒政策

    提醒政策对话框随即打开,其中已填充条件字段。 建议您查看所有设置并做出以下修改:

    • 更新条件阈值。默认值可能不符合要求。
    • 将通知渠道添加到政策中。
    • 为政策命名。

    如需了解详情,请参阅创建提醒政策

调查指标存在的问题

您可以使用指标管理页面来调查计费指标的结构或使用问题。例如,您可能会遇到以下情况:

  • 可归因于特定指标的可结算量增加。
  • 针对特定指标的查询延迟时间增加的报告。
  • 写入指标数据时出错,原因可能是达到写入的数据量或速率上限。

写入指标数据时发生错误的相关情况可能与其他问题相关,例如计费量意外增加或查询延迟时间增加。例如,指标配置的更改可能会导致基数问题,这可能会影响提取的数据量和查询延迟时间,还可能导致指标写入错误。

查看指标写入错误

指标写入错误统计信息摘要中,您可以执行以下操作:

  • 查看指标写入请求的状态。
  • 创建提醒政策,以便在指标写入错误率超过阈值时收到通知。
  • 查看审核日志中是否存在指标写入错误(如果已启用审核日志)。这些日志可让您深入了解指标写入错误的原因。

如需查看写入指标数据时出错的相关信息,请执行以下操作:

  1. 在 Google Cloud 控制台中,转到 指标管理页面:

    进入指标管理

    如果您使用搜索栏查找此页面,请选择子标题为监控的结果。

  2. 在工具栏中,选择您的时间范围。
  3. 点击指标写入错误统计信息摘要中的查看错误

    • 如需查看向 Cloud Monitoring API 发出的指标写入请求的状态,请使用 API - 创建时间序列(状态代码)图表。此图表显示了对 timeSeries.create 方法的调用。

      每个时序都会显示特定 HTTP 状态代码的写入速率。如果图表显示 2xx 状态结果为单线,则表示没有指标写入错误。以下屏幕截图显示了 2xx 状态结果以及少量 4xx 和 5xx 状态结果:

      **指标写入错误** 图表显示写入时间序列数据的错误率。

      如果您发现指标写入请求数量增加,则可能会遇到基数问题。

    • 如果图表显示错误的状态代码,并且您已为项目启用了审核日志,则可以使用这些日志来调查错误的原因。日志的预配置查询会查找与 Monitoring API 方法 timeSeries.create 关联的错误。每次写入指标时都会调用此方法。

      timeSeries.create 错误日志可让您详细了解出现错误状态代码的原因。例如,如果您尝试一次写入太多数据,或者超出活跃时序的数量限制,此方法可能会失败。如需了解详情,请参阅 Monitoring 配额文档中的用户定义的指标部分。

调查指标创建错误

与可能失败的指标相关的另一种方法是 metricDescriptors.create 方法。首次为新指标写入时间序列数据时,或者您更改指标数据的结构时(很可能通过添加新标签),系统会调用 metricDescriptors.create 方法。此方法的错误审核日志可从指标表中每个指标的条目中获取。

如需查看特定指标的审核日志,请执行以下操作:

  1. 在 Google Cloud 控制台中,转到 指标管理页面:

    进入指标管理

    如果您使用搜索栏查找此页面,请选择子标题为监控的结果。

  2. 在工具栏中,选择您的时间范围。
  3. 在表格中找到该指标,然后点击  操作
  4. 选择查看指标审核日志

    日志的预配置查询会查找与 Monitoring API 方法 metricDescriptors.create 关联的错误。

metricDescriptors.create 方法中的错误可帮助您确定指标设计中可能存在的问题。如果超出允许的指标描述符数量或指标描述符中的标签数量超出上限,您可能会在此方法中看到错误。如需了解详情,请参阅 Monitoring 配额文档中的用户定义的指标部分。

后续步骤