查看和管理指标使用情况

本文档介绍了 Cloud Monitoring 的指标管理页面,该页面中的信息可帮助您在不影响可观测性的情况下控制可计费指标的支出金额。您可以使用指标管理页面执行以下操作:

  • 确定您在项目中主动收集的计费指标。
  • 确定哪些项目发送的数据最多。
  • 了解与 Google Cloud 项目中使用的可计费指标相关的费用。
  • 设置提醒,以便在使用规律发生变化时收到通知。您可以设置提醒,以便指标数据的整体提取以及任何指标的行为。
  • 了解可计费指标在自定义信息中心和提醒政策中的使用情况。如果您未在任何信息中心或提醒政策中使用某个指标,则该指标在可观测性上不会带来任何好处。
  • 为没有关联的提醒政策或信息中心的指标创建图表和提醒政策。
  • 找出可计费指标的基数可能存在的问题。
  • 排查写入指标数据时出现的错误。
  • 查看与可计费指标的收集相关联的审核日志。如需了解审核日志的一般信息,请参阅 Cloud Audit Logs 概览

指标管理页面显示了您的 Google Cloud 项目有权访问的计费指标的相关信息。您的 Google Cloud 项目有权访问其指标范围可见的所有指标。

指标管理页面还提供指向当前 Google Cloud 项目中定义的提醒政策和自定义信息中心的链接。如需查看指标范围内但在其他项目中定义的指标的提醒政策或自定义信息中心,请使用项目选择器选择存储该指标的 Google Cloud 项目。

您还可以在指标管理页面中查看与指标中的错误相关的审核日志。这些日志可以帮助您确定错误的原因。

可计费指标的定价模式

一般来说,Cloud Monitoring 系统指标是免费的,来自外部系统或应用的指标不是。计费指标按注入的字节数或样本数计费。本部分介绍基于字节和样本的注入。

如需详细了解 Cloud Monitoring 中的收费功能,请参阅价格文档中的 Cloud Monitoring。如需了解价格信息,请参阅 Cloud Monitoring 价格摘要

按注入的字节数或样本数结算

计费指标按字节数或注入的样本数计费。每次写入指标时,写入操作都会包含一个数据值。数据值可以是标量(如整数或浮点数),也可以是分布(包含多个不同值的复杂数据类型)。如需详细了解指标可能写入的值类型,请参阅值类型

写入指标的频率(采样率)和指标写入的数据类型(标量或分布)都会影响注入的数据量,不论提取是按注入的字节数还是注入的样本数收费。

  • “提取的字节数”表示按注入的数据量收费(以字节为单位)。为了便于定价,每个标量值计为 8 个字节,每次分布计为 80 个字节。如需了解详情和示例,请参阅按注入的字节数收费的指标

  • “提取的样本数”表示根据注入的测量值数量收费。为了便于定价,每个标量值都算作一个样本,每个分布情况也被计为两个样本加上一个非零数量直方图分桶。如需了解详情和示例,请参阅按注入的样本数收费的指标

这两种价格模式之间最大的区别在于分布值。基于字节的提取对分布收取固定费率,但基于样本的提取会考虑分布中的数据;对于具有稀疏直方图的分布(很少有具有非零值的直方图分区)来说,相较于密集直方图分布(大多数分区具有非零值),计算的样本数要少。

指标管理页面上的可计费指标

指标管理页面按网域报告可计费指标。您可以通过网域了解指标的收集方式和收集来源。

下表介绍了指标管理页面上可用的计费指标类别,以及它们是按注入的字节数还是按注入的样本数进行测量的:

网域 指标前缀 价格模式 含义
代理 agent.googleapis.com 字节 代理从外部资源收集的指标。如需查看这些指标的列表,请参阅 Ops Agent 指标以及旧版 Monitoring 和 Logging 指标。旧版 Monitoring 代理收集的第三方集成指标也会报告为“代理”指标;请参阅第三方应用指标

agent.googleapis.com/processes/ 指标按其他收费指标的容量费率的 5% 计费。例如,提取 100 MiB 的进程指标的费用与提取 5 MiB 的其他收费指标的费用相同。

这些代理还会收集关于自身的指标。这些指标由前缀 agent.googleapis.com/agent 标识,不可计费,且不会显示在指标管理页面上。

用户定义的、自定义 custom.googleapis.com 字节 您定义的指标。
外部 external.googleapis.com 字节 来自某些开源库或第三方提供商的指标。 如需了解详情,请参阅外部指标
工作负载 workload.googleapis.com 字节 Ops Agent 写入的第三方集成指标。如需查看这些指标的列表,请参阅第三方应用指标
Prometheus prometheus.googleapis.com 示例 通过使用 Google Cloud Managed Service for Prometheus 或使用 Ops Agent 和 Prometheus 接收器OTLP 接收器收集的指标。

其他计费指标

指标管理页面不会报告以下类别的计费指标:

  • 用户定义的基于日志的指标。这些指标是通过统计日志条目中的值得出的,具有前缀 logging.googleapis.com/user。用户定义的基于日志的指标按注入的字节数收费。
  • 使用 AWS 连接器项目收集的 AWS CloudWatch 指标。这些指标的前缀为 aws.googleapis.com,按注入的字节数收费。

准备工作

如需查看指标管理页面上包含的图表和日志并创建提醒政策,您必须拥有正确的授权

授权

  • 如需获得使用 Google Cloud 控制台查看信息中心和创建提醒政策所需的权限,请让管理员授予您项目的 Monitoring Editor (roles/monitoring.editor) IAM 角色。 如需详细了解如何授予角色,请参阅管理访问权限

    您也可以通过自定义角色或其他预定义角色来获取所需的权限。

  • 如需获取查看审核日志所需的权限,请让管理员授予您项目的 Private Logs Viewer (roles/logging.privateLogViewer) IAM 角色。如需详细了解如何授予角色,请参阅管理访问权限

    您也可以通过自定义角色或其他预定义角色来获取所需的权限。

    如需详细了解角色,请参阅使用 Identity and Access Management 控制访问权限

  • 启用审核日志记录后,您可以在指标管理页面上查看这些指标生成的审核日志。如需将项目配置为在读取或写入数据时生成审核日志,请执行以下操作:

    1. 在 Google Cloud 控制台中,前往审核日志页面:

      前往审核日志

      如果您使用搜索栏查找此页面,请选择子标题为 IAM 和管理的结果。

    2. 在过滤栏中输入 Stackdriver Monitoring API
    3. 选择 Stackdriver Monitoring API
    4. 日志类型标签页中,选择数据写入数据读取,然后点击保存

    如需了解详情,请参阅配置数据访问审核日志

查看有关指标范围的信息

指标管理页面中显示的一组指标取决于项目的指标范围。如果您的项目只有自身的指标范围,则指标管理页面上的指标来自当前项目。如果项目的指标范围内有多个项目,则指标管理页面上显示的指标包括所有这些项目的指标。对费用贡献最大的指标可能来自另一个项目。

如需查看项目范围信息的摘要,请点击指标范围。此摘要包含以下内容:

  • 有权访问项目的 IAM 主账号。这组主账号包括用户、群组和服务帐号。
  • 指标范围内可见的免费指标和可计费指标的数量。
  • 当前项目监控的项目的列表。您可以在指标管理页面上找到所有这些项目的可计费指标。
  • 可查看当前项目指标的任何项目的相关信息。

如需详细了解指标范围,请参阅配置多项目视图

研究可计费指标

指标管理页面会提供一个表,其中包含指标范围中的每个可计费指标。您可以使用此表执行以下操作:

  • 按具有某项功能的类别对可计费指标进行过滤。 通过查看指标类别,可能会发现在查看表中所有指标时难以检测到的模式。
  • 确定任意指标对可结算量的贡献。
  • 确定收集但不在任何提醒政策或信息中心内使用的指标。未使用指标数据可能表示存在可观测性缺口或有节省费用的机会。
  • 为没有关联提醒政策或自定义信息中心的指标创建提醒政策或图表。
  • 确定指标数据的来源项目。该表包含指标范围内所有项目的指标,并且您可能需要了解从项目中收集特定指标的信息。
  • 查看有关每个指标的标签和基数信息。当您调查指标设计或使用情况方面的问题时,这些信息会很有帮助。

如需查看每个计费指标的用量数据表,请执行以下操作:

  1. 在 Google Cloud 控制台中,前往  指标管理页面:

    进入指标管理

    如果您使用搜索栏查找此页面,请选择子标题为监控的结果。

  2. 在工具栏中,选择时间窗口。默认情况下,指标管理页面会显示有关前一天收集的指标的信息。以下屏幕截图显示了指标表格的示例:

    指标表格会显示指标范围内项目中每个指标的信息。

选择要查看的指标

为了管理费用,您需要了解哪些可计费指标产生的流量最多。例如,仅仅知道每小时提取 60 MiB 的数据是不够的。但是,如果您知道大部分可计费数据都是由一个或两个指标导致的,则可以调查这些指标的使用情况。

如需列出可计费指标,请执行以下操作:

  1. 在 Google Cloud 控制台中,前往  指标管理页面:

    进入指标管理

    如果您使用搜索栏查找此页面,请选择子标题为监控的结果。

  2. 在工具栏中,选择时间窗口。默认情况下,此标签页会显示有关前一天收集的指标的信息。
  3. 若要仅显示特定指标组,请使用快速过滤器直接过滤表格

指标表列出了当前 Google Cloud 项目的指标范围内的可计费指标。对于每个指标,该表会显示该指标在可计费量中所占的比重,并提供指向与该指标关联的提醒政策和自定义信息中心的链接,如以下屏幕截图所示。如果没有与指标相关联的提醒政策或信息中心,则该表中会包含一个按钮,您可以点击该按钮创建一个按钮。

指标表格会显示指标范围内项目中每个指标的信息。

如需按指标在可结算量中的贡献进行排序,请点击可计费的字节数/总计可计费的样本数/总计的列标题。

指标表还会显示指标的网域、指标的标签集、指标提取来源的项目以及指标的基数。以下屏幕截图展示了这些列的示例。

指标表格会报告指标范围内指标的指标网域、标签、项目 ID 和基数。

标签和基数信息可能有助于确定可计费量增加的原因。在 Cloud Monitoring 中,基数是指与指标和资源关联的时序数,与标签及其值相关;标签值的每个组合都有一个时序。如需了解详情,请参阅基数

可计费量的变化意味着您要提取更多数据,如果变化是突然的或意外的,则原因可能是与指标关联的标签数量发生变化,或者标签值的设置方式发生了变化。这两种情况都可能会增加指标的基数,从而导致可结算量增加。如需了解如何使用指标管理来帮助识别指标问题,请参阅调查指标问题

使用快速过滤条件

如需仅查看以下组中的指标,请在快速过滤条件窗格中选择一个条目:

  • 活跃指标和非活跃指标:过去 25 小时内已写入或未写入时间序列数据的指标。
  • 当前 Google Cloud 项目的提醒政策中使用或未使用的指标。
  • 当前 Google Cloud 项目的自定义信息中心内使用或不使用的指标。这些过滤条件不包含 Cloud Monitoring 提供的预定义信息中心内使用的指标。
  • 指标的类别,如计费指标摘要中所述。

您可以使用过滤条件窗格,按可过滤的特征选择指标。

例如,如果您的某些指标未在提醒政策或自定义信息中心中使用,那么您可能需要为这些指标付费,但无法从这些指标中获得任何可观测性好处。通过选择无提醒政策无自定义信息中心快速过滤条件,您可以列出在当前 Google Cloud 项目中定义的没有任何提醒政策或自定义信息中心中显示的指标。

直接过滤表格

如果没有合适的快速过滤条件,您可以使用  过滤栏搜索一组指标。例如,如果您的指标范围是多项目,并且您只想列出该项目中的指标,则无法使用快速过滤器。如需仅列出特定项目中的指标,请从过滤条件列表中选择 Project,然后输入项目的标识符。

您还可以使用显式过滤条件来搜索与过滤条件组合匹配的指标。一次只能选择一个快速过滤器,因此您无法使用快速过滤器仅列出提醒政策或自定义信息中心内都没有出现的活跃指标。如需搜索与一系列要求匹配的指标,请向过滤栏添加过滤条件。例如,如需列出没有提醒政策和自定义信息中心内出现的活跃指标,请在过滤栏中添加以下过滤条件:

  • Status: Active
  • Alert Policies: (Empty)
  • Custom Dashboards: (Empty)

默认情况下,如果您添加多个过滤条件,则当该行符合所有过滤条件时,表中会包含该行。不过,您可以在两个其他过滤器元素之间插入 OR 过滤器。

为不受监控的指标创建提醒政策

当表中的指标没有关联的提醒政策时,该表会提供一个创建提醒按钮。如需为指标创建提醒政策,请点击指标所在行中的创建提醒

此时将打开提醒政策对话框,其中填充了条件字段。建议您检查所有设置并做出以下修改:

  • 更新条件阈值。默认值可能不尽人意。
  • 将通知渠道添加到政策中。
  • 为政策命名。

您还可以为任何指标创建提醒政策,方法是点击  操作,然后点击为指标创建提醒

如需了解详情,请参阅创建提醒政策

为不受监控的指标创建图表

如果表中的指标没有关联的自定义信息中心,则该表会提供一个创建图表按钮。您可以使用此按钮创建图表并将其放置在自定义信息中心内。如需为指标创建图表,请执行以下操作:

  1. 点击指标所在行中的创建图表

    分层图表面板随即会打开,并已预先配置为显示所选指标。您可以修改图表配置。 如需详细了解如何使用 Metrics Explorer,请参阅使用 Metrics Explorer 创建图表

  2. 如需将图表保存到自定义信息中心,请点击保存到信息中心

  3. Save Chart 面板上,执行以下操作:

    1. 接受或修改图表的默认标题。
    2. 选择要将图表保存到的现有自定义信息中心,或选择新建信息中心为图表创建新信息中心。
    3. 点击保存图表

使用指标

虽然您可以使用指标管理页面查看有关指标的一些信息,但您可能需要更多信息。例如,您可能希望查看特定指标的图表,或创建提醒政策,以便在该指标的提取率超出预期时收到通知。

如需获取有关特定指标的更多详细信息,请执行以下操作:

  1. 在 Google Cloud 控制台中,前往  指标管理页面:

    进入指标管理

    如果您使用搜索栏查找此页面,请选择子标题为监控的结果。

  2. 在表格中找到该指标,然后点击  操作以执行以下任一操作:

    • 如需查看显示当前指标的图表,请选择在 Metrics Explorer 中查看

      Metrics Explorer 随即会打开并经过预先配置,以显示所选指标。您可以修改图表配置、舍弃图表配置,或将其添加到自定义信息中心。

    • 如需创建用于监控该指标的提醒政策,请选择为指标创建提醒

      此时将打开提醒政策对话框,其中填充了条件字段。建议您检查所有设置并做出以下修改:

      • 更新条件阈值。默认值可能不尽人意。
      • 将通知渠道添加到政策中。
      • 为政策命名。

      如需了解详情,请参阅创建提醒政策

    • 如需查看与指标关联的审核日志,请选择查看指标审核日志

查看计费指标的注入和提醒

注入的计费字节数和计费样本数决定了您的大部分费用。如需预测因使用可结算指标而产生的每月费用,您需要知道数据注入的速率。指标管理页面提供指标使用情况摘要,可帮助您执行以下操作:

  • 查看可计费指标的使用趋势。
  • 确定指标范围内的项目发送的指标数据数量是否高于预期。
  • 确定生成最多数据的指标。
  • 确定负责生成最多 Prometheus 数据的命名空间。
  • 查看指标中的写入错误率。错误率是指返回错误状态的指标写入操作占指标写入总次数的百分比。

查看指标使用情况摘要

如需查看计费指标数量、指标提取速率和错误率的摘要,请执行以下操作:

  1. 在 Google Cloud 控制台中,前往  指标管理页面:

    进入指标管理

    如果您使用搜索栏查找此页面,请选择子标题为监控的结果。

  2. 在工具栏中,选择时间窗口。默认情况下,指标管理页面会显示有关前一天收集的指标的信息。以下屏幕截图展示了一个示例:

    摘要窗格会显示指标范围内各个项目的指标使用情况。

    • 如需查看您的指标范围内项目中当前活跃的计费指标数量摘要,请参阅活跃指标统计信息摘要。如果在过去 25 小时内向指标写入数据,则该指标处于活跃状态。

    • 如需确定哪些因素导致了费用,请使用注入的计费字节数注入的计费样本数统计信息摘要。如需了解详情,请参阅查看指标提取的总体趋势

    • 如需查找可能帮助您识别计费指标设计或使用方面的问题的信息,请使用指标写入错误统计信息摘要。如需了解详情,请参阅调查指标的问题

指标管理页面显示您正在提取的数据量,而不是实际费用。如需查看当前结算信息,请点击工具栏中的查看结算信息

查看指标提取的总体趋势

如需确定您的应用生成的数据量是否一致(这是稳定应用的预期行为),请使用提取统计信息摘要查看收集速率。通过更改用于查看指标的时间范围,您可能会看到低谷、峰值或趋势。

如需查看一段时间内的收集速率,请执行以下操作:

  1. 在 Google Cloud 控制台中,前往  指标管理页面:

    进入指标管理

    如果您使用搜索栏查找此页面,请选择子标题为监控的结果。

  2. 在工具栏中,选择时间范围。
  3. 点击注入的字节数或样本的统计信息摘要上的查看图表。此处的讨论指的是可计费样本的图表,但可计费字节数的图表的工作原理相同。您会看到一组如下所示的图表:

    汇总指标提取的图表示例。

    默认情况下,图表图例处于收起状态。如需查看图表中显示的时序列表,请点击  图例。如需了解如何设置时间引用或在特定时间范围内展开图表,请参阅探索已绘制成图表的数据

例如,如果您将时间范围设置为一周,并且发现提取的数据随时间而不断增加但意外增加,则可以查看增加是来自某个特定指标,还是基于一组指标的总体趋势。如果某个指标是可靠的,您可以调查指标的基数是否也在增加。

  • 如需查看注入当前指标范围的计费样本的费率,请使用注入的计费样本总数图表。

  • 如需查看指标范围内每个项目对总计费值的贡献,请使用按注入的计费样本数统计的项目图表。此图表可以告诉您哪些项目发送的数据最多,以及是否有任何项目发送的数据量增加或减少。

  • (仅限可计费示例)如需查找发送指标对计费值影响最大的命名空间,请使用命名空间卷提取图表。

  • 如需查看指标范围内对计费值影响最大的指标,请使用注入的计费样本数的前 10 个指标图表。您可能需要查找收集率的峰值、低谷或趋势,或者寻找与其他所有指标都截然不同的指标。

  • 如需查看指标范围内所有指标的可计费值的贡献量,请使用所有指标(按注入的计费样本数)图表。此图表包含前 10 个图表中的指标,可向您显示指标中收集率的总体分布情况。

如需更详细地分析其中任何图表,请点击  更多选项,然后选择在 Metrics Explorer 中查看。如需查看以命名空间卷提取图表开头并使用 Metrics Explorer 执行提取量归因的示例,请参阅以下内容:

如需详细了解如何使用 Metrics Explorer 分析数据,包括比较当月行为与上个月行为等操作,请参阅探索已绘制成图表的数据

根据指标注入创建提醒

如需在可计费指标的指标收集率上升、下降或趋势时收到通知,请创建提醒政策。例如,指标集合下降可能表示应用性能不佳。同样,高峰也可能会导致意外扣款。最后,向上趋势可能表示指标的标签过多或基数在增加。在所有情况下,提醒政策都可以通知您异常行为,然后您可以解决这种情况。

如果指标都是按注入的字节数结算的,并且指标也是按注入的样本数进行结算的,则需要为这两个结算值创建提醒政策。

如需创建用于监控指标收集速率的提醒政策,请执行以下操作:

  1. 在 Google Cloud 控制台中,前往  指标管理页面:

    进入指标管理

    如果您使用搜索栏查找此页面,请选择子标题为监控的结果。

  2. 在工具栏中,选择时间范围。
  3. 点击注入的字节数或样本的统计信息摘要上的查看图表
  4. 在您要监控其数据的图表中,点击创建提醒政策

    此时将打开提醒政策对话框,其中填充了条件字段。建议您检查所有设置并做出以下修改:

    • 更新条件阈值。默认值可能不尽人意。
    • 将通知渠道添加到政策中。
    • 为政策命名。

    如需了解详情,请参阅创建提醒政策

调查指标存在的问题

您可以使用指标管理页面调查可计费指标的结构或使用问题。例如,您可能会遇到以下情况:

  • 可归因于特定指标的可结算量增加。
  • 有关增加特定指标的查询延迟时间的报告。
  • 写入指标数据时出错,这可能是因为达到写入数据量或速率的上限。

写入指标数据中的错误可能与其他问题有关,例如可计费量意外增加或查询延迟时间增加。例如,如果指标配置发生更改,可能会导致基数问题,进而影响提取的数据量和查询延迟时间,并且还可能会导致指标写入错误。

查看指标写入错误

指标写入错误统计信息摘要中,您可以执行以下操作:

  • 查看指标写入请求的状态。
  • 创建提醒政策,以便在指标写入错误率超过阈值时通知您。
  • 查看审核日志中是否存在指标写入错误(如果您已启用审核日志)。这些日志可让您深入了解指标写入错误的原因。

如需查看有关写入指标数据的错误的信息,请执行以下操作:

  1. 在 Google Cloud 控制台中,前往  指标管理页面:

    进入指标管理

    如果您使用搜索栏查找此页面,请选择子标题为监控的结果。

  2. 在工具栏中,选择时间范围。
  3. 点击指标写入错误统计信息摘要中的查看错误

    • 如需查看向 Cloud Monitoring API 发出的指标写入请求的状态,请使用 API - 创建时序(状态代码)图表。此图表显示了对 timeSeries.create 方法的调用。

      每个时序都会显示特定 HTTP 状态代码的写入速率。当图表显示 2xx 状态结果的单条线时,您不存在指标写入错误。以下屏幕截图显示了 2xx 状态结果和少量 4xx 和 5xx 状态结果:

      **指标写入错误数** 图表会显示写入时间序列数据的错误率。

      如果您发现指标写入请求的数量有所增加,则可能遇到了基数问题。

    • 如果图表显示错误的状态代码,并且如果您为项目启用了审核日志,则可以使用日志调查错误的原因。针对日志的预配置查询会查找与 Monitoring API 方法 timeSeries.create 关联的错误。每次写入指标时,系统都会调用此方法。

      timeSeries.create 错误的日志可以告诉您有关错误状态代码的原因。例如,如果您尝试一次性写入过多数据,或者活跃时序的数量超出了限制,此方法可能会失败。如需了解详情,请参阅 Monitoring 配额文档中的用户定义的指标部分。

调查指标创建错误

与可能失败的指标相关的另一种方法是 metricDescriptors.create 方法。当您首次为新指标写入时间序列数据时,或者如果您更改指标数据的结构(很可能是通过添加新标签),就会调用 metricDescriptors.create 方法。有关此方法的错误的审核日志可从指标表中每个指标的条目中找到。

如需查看特定指标的审核日志,请执行以下操作:

  1. 在 Google Cloud 控制台中,前往  指标管理页面:

    进入指标管理

    如果您使用搜索栏查找此页面,请选择子标题为监控的结果。

  2. 在工具栏中,选择时间范围。
  3. 在表格中找到该指标,然后点击  操作
  4. 选择查看指标审核日志

    针对日志的预配置查询会查找与 Monitoring API 方法 metricDescriptors.create 关联的错误。

metricDescriptors.create 方法中的错误有助于您识别指标设计中可能存在的问题。如果超出允许的指标描述符数量或指标描述符中的标签数量,此方法可能会出现错误。如需了解详情,请参阅 Monitoring 配额文档中的用户定义的指标部分。

后续步骤