查看和管理指标使用情况

本文档介绍了 Cloud Monitoring 指标管理页面,该页面提供的信息可帮助您在不影响可观测性的情况下控制可计费指标的支出金额。您可以使用指标管理页面执行以下操作:

  • 确定您在项目中主动收集的可计费指标。
  • 确定哪些项目发送的数据最多。
  • 了解与 Google Cloud 项目中使用的可计费指标相关的费用。
  • 设置提醒,以便在使用模式发生变化时收到通知。您可以设置提醒,以便了解指标数据的整体提取情况以及任何指标的行为。
  • 查看可计费指标在自定义信息中心和提醒政策中的使用情况。如果您不在任何信息中心或提醒政策中使用某个指标,则该指标不会带来任何可观测性优势。
  • 为没有关联的提醒政策或信息中心的指标创建图表和提醒政策。
  • 确定可计费指标的基数可能存在的问题。
  • 排查写入指标数据时出现的错误。
  • 查看与可计费指标的收集相关的审核日志。如需了解审核日志的一般信息,请参阅 Cloud Audit Logs 概览

指标管理页面会显示 Google Cloud 项目有权访问的计费指标的相关信息。您的 Google Cloud 项目有权访问其指标范围可见的所有指标。

指标管理页面还提供指向当前 Google Cloud 项目中定义的提醒政策和自定义信息中心的链接。如需查看指标范围内但在不同项目中定义的指标的提醒政策或自定义信息中心,请使用项目选择器选择存储该指标的 Google Cloud 项目。

您还可以通过指标管理页面查看与指标中的错误相关的审核日志。这些日志可以帮助您确定错误的原因。

计费指标的定价模式

一般来说,Cloud Monitoring 系统指标是免费的,来自外部系统或应用的指标则不收费。计费指标按注入的字节数或注入的样本数计费。本部分介绍基于字节和样本的提取。

如需详细了解 Cloud Monitoring 中的收费功能,请参阅价格文档中的 Cloud Monitoring。如需了解价格信息,请参阅 Cloud Monitoring 价格摘要

按注入的字节数或样本数结算

计费指标按注入的字节数或注入的样本数计费。每次写入指标时,写入操作都会包含一个数据值。数据值可以是标量(如整数或浮点数),也可以是分布(包含多个不同值的复杂数据类型)。如需详细了解指标可能写入的值类型,请参阅值类型

写入指标的频率(采样率和指标写入的数据类型(标量或分布))都会影响注入的数据量,无论提取是按注入的字节数还是注入的样本数计费。

  • “提取的字节数”是指根据注入的数据量(以字节为单位)收费。为了便于定价,每个标量值计为 8 个字节,每个分布计为 80 个字节。如需了解详情和查看示例,请参阅按注入的字节数收费的指标

  • “注入的样本数”表示根据注入的测量数收取费用。为便于定价,每个标量值都算作一个样本,每个分布都算作两个样本加一个(针对具有非零计数的直方图存储桶)。如需了解详情和示例,请参阅按注入的样本数收费的指标

这两种价格模式之间最大的区别在于分布值。基于字节的提取会针对分布收取固定费率,但基于样本的提取会考虑分布中的数据;具有稀疏直方图的分布(具有非零值的几个直方图分区)的样本数少于具有密集直方图的分布(其中大多数分区具有非零值)。

指标管理页面上的可计费指标

指标管理页面按网域报告可计费指标。通过该网域,您可以了解指标的收集方式和收集位置。

下表介绍了指标管理页面上提供的计费指标的类别,以及这些指标是按注入的字节数还是按注入的样本数进行测量的:

网域 指标前缀 价格模式 含义
代理 agent.googleapis.com 字节 代理从外部资源收集的指标。如需查看这些指标的列表,请参阅 Ops Agent 指标旧版 Monitoring 和 Logging 指标。旧版 Monitoring 代理收集的第三方集成指标也会报告为“代理”指标;请参阅第三方应用指标

agent.googleapis.com/processes/”指标按其他收费指标音量的 5% 计费。 例如,提取 100 MiB 的进程指标的费用与提取 5 MiB 的其他收费指标的费用相同。

这些代理还会收集关于自身的指标。这些指标由前缀 agent.googleapis.com/agent 标识,不可计费,也不会显示在指标管理页面上。

用户定义的、自定义 custom.googleapis.com 字节 定义的指标。
外部 external.googleapis.com 字节 来自某些开源库或第三方提供商的指标。 如需了解详情,请参阅外部指标
工作负载 workload.googleapis.com 字节 Ops Agent 写入的第三方集成中的指标。如需查看这些指标的列表,请参阅第三方应用指标
Prometheus prometheus.googleapis.com 示例 使用 Google Cloud Managed Service for Prometheus 或者 Ops Agent 和 Prometheus 接收器OTLP 接收器收集的指标。

其他计费指标

指标管理页面不会报告以下类别的可计费指标:

  • 用户定义的基于日志的指标。这些指标是通过对日志条目中的值进行计数而得出的,带有 logging.googleapis.com/user 前缀。用户定义的基于日志的指标按注入的字节数收费。
  • 使用 AWS 连接器项目收集的 AWS CloudWatch 指标。这些指标的前缀为 aws.googleapis.com,按注入的字节数收费。

准备工作

如需查看指标管理页面上包含的图表和日志并创建提醒政策,您必须拥有正确的授权

授权

  • 如需获取使用 Google Cloud 控制台查看信息中心和创建提醒政策所需的权限,请让管理员向您授予项目的 Monitoring Editor (roles/monitoring.editor) IAM 角色。如需详细了解如何授予角色,请参阅管理访问权限

    您也可以通过自定义角色或其他预定义角色来获取所需的权限。

  • 如需获取查看审核日志所需的权限,请让管理员向您授予项目的 Private Logs Viewer (roles/logging.privateLogViewer) IAM 角色。如需详细了解如何授予角色,请参阅管理访问权限

    您也可以通过自定义角色或其他预定义角色来获取所需的权限。

    如需详细了解角色,请参阅使用 Identity and Access Management 控制访问权限

  • 启用审核日志记录后,您可以在指标管理页面上查看这些指标生成的审核日志。如需将项目配置为在读取或写入数据时生成审核日志,请执行以下操作:

    1. 在 Google Cloud 控制台的导航面板中,选择 IAM 和管理,然后选择审核日志

      前往审核日志

    2. 在过滤栏上输入 Stackdriver Monitoring API
    3. 选择 Stackdriver Monitoring API
    4. 日志类型标签页中,选择数据写入数据读取,然后点击保存

    如需了解详情,请参阅配置数据访问审核日志

查看有关您的指标范围的信息

指标管理页面中显示的一组指标取决于项目的指标范围。如果您的项目的指标范围内只有自己,那么指标管理页面上的指标来自当前项目。如果项目的指标范围内有多个项目,则指标管理页面上显示的指标包括所有这些项目的指标。对费用影响最大的指标可能来自另一个项目。

如需查看项目范围信息的摘要,请点击指标范围。此摘要包含以下内容:

  • 有权访问项目的 IAM 主账号。这组主帐号包括用户、群组和服务帐号。
  • 指标范围内可见的免费指标和可计费指标的数量。
  • 当前项目监控的项目的列表。指标管理页面上提供了所有这些项目的可计费指标。
  • 可查看当前项目指标的任何项目的相关信息。

如需详细了解指标范围,请参阅配置多项目视图

调查可计费指标

指标管理页面提供了一个表格,其中包含指标范围中的每个可计费指标。您可以使用此表执行以下操作:

  • 按具有相同功能的类别对可计费指标进行过滤。 通过查看指标类别,可能会揭示在查看表中的所有指标时难以检测到的模式。
  • 确定任何指标对可结算量的贡献。
  • 识别收集但未用于任何提醒政策或信息中心的指标。未使用的指标数据可能表示可观测性缺口或有节省费用的机会。
  • 为没有关联的提醒政策或自定义信息中心的指标创建提醒政策或图表。
  • 确定生成指标数据的项目。该表包含指标范围内所有项目的指标,并且您可能需要了解从项目中收集特定指标的信息。
  • 查看有关每个指标的标签和基数信息。在您调查指标设计或使用指标方面的问题时,这些信息会很有帮助。

如需查看每个计费指标的用量数据表,请执行以下操作:

  1. 在 Google Cloud 控制台的导航面板中,选择 Monitoring,然后选择  指标管理

    转到指标管理

  2. 在工具栏中,选择时间窗口。默认情况下,指标管理页面会显示前一天收集的指标的相关信息。以下屏幕截图显示了指标表的示例:

    指标表会显示指标范围内项目中每个指标的相关信息。

选择要查看的指标

为了管理费用,您需要了解哪些可计费指标产生的流量最多。例如,仅仅知道每小时提取 60 MiB 的数据是不够的。但是,如果您知道大多数计费数据都来自一个或两个指标,则可以调查这些指标的使用情况。

如需列出可计费指标,请执行以下操作:

  1. 在 Google Cloud 控制台的导航面板中,选择 Monitoring,然后选择  指标管理

    转到指标管理

  2. 在工具栏中,选择时间窗口。默认情况下,此标签页会显示有关前一天所收集指标的信息。
  3. 若要仅显示特定指标组的数据,请使用快速过滤器直接过滤表格

指标表列出了当前 Google Cloud 项目指标范围内的可计费指标。对于每个指标,该表都会显示该指标在可计费量中的占比,并提供指向与该指标关联的提醒政策和自定义信息中心的链接,如以下屏幕截图所示。如果没有与指标相关联的提醒政策或信息中心,该表会包含一个按钮,您可以点击按钮创建一个。

指标表会显示指标范围内项目中每个指标的相关信息。

如需按指标对可结算量的贡献对指标进行排序,请点击可结算字节数/总计可计费样本数/总计的列标题。

指标表还显示了指标的网域、指标的标签集、从中提取指标的项目以及指标的基数。以下屏幕截图展示了这些列的示例。

指标表格会报告指标范围内指标的指标网域、标签、项目 ID 和基数。

标签和基数信息可能有助于确定可计费量增加的原因。在 Cloud Monitoring 中,基数是指与指标和资源关联的时序数,与标签及其值相关;标签值的每个组合都有一个时间序列。如需了解详情,请参阅基数

可计费量的变化表示您需要提取更多数据,如果变化是突然的或意外的,则原因可能是与指标关联的标签数量发生变化,或者标签值的设置方式发生变化。这两种情况都可能会增加指标的基数,从而导致可计费量增加。如需了解如何使用指标管理来帮助识别指标问题,请参阅调查指标的问题

使用快速过滤器

如需仅查看以下组中的指标,请在快速过滤器窗格中选择一个条目:

  • 活跃指标和非活跃指标:在过去 25 小时内具有或未写入时间序列数据的指标。
  • 当前 Google Cloud 项目的提醒政策中使用或未使用的指标。
  • 当前 Google Cloud 项目的自定义信息中心内使用或不使用的指标。这些过滤条件不包括 Cloud Monitoring 提供的预定义信息中心内使用的指标。
  • 指标类别,如计费指标摘要中所述。

您可以使用过滤器窗格,按可过滤的特征选择指标。

例如,如果您的提醒政策或自定义信息中心不使用某些指标,那么您可能需要为指标付费,但这些指标无法带来任何可观测性优势。您可以通过选择无提醒政策无自定义信息中心快速过滤条件,列出当前 Google Cloud 项目中未定义任何提醒政策或未定义自定义信息中心的指标。

直接过滤表格

如果没有合适的快速过滤条件,您可以使用  过滤栏搜索一组指标。例如,如果您的指标范围是多项目,而您希望仅列出该项目的指标,就不能使用快速过滤条件。如需仅列出特定项目的指标,请从过滤条件列表中选择 Project,然后输入项目的标识符。

您还可以使用显式过滤条件来搜索与过滤条件组合匹配的指标。您一次只能选择一个快速过滤器,因此无法使用快速过滤器仅列出提醒政策或自定义信息中心都没有显示的有效指标。如需搜索与一系列要求匹配的指标,请向过滤条件栏添加过滤条件。例如,如需列出未出现在提醒政策和自定义信息中心内的活跃指标,请在过滤条件栏中添加以下过滤条件:

  • Status: Active
  • Alert Policies: (Empty)
  • Custom Dashboards: (Empty)

默认情况下,如果您添加多个过滤条件,则当该行符合所有过滤条件时,表会包含该行。不过,您可以在两个其他过滤器元素之间插入 OR 过滤器。

为不受监控的指标创建提醒政策

如果表中的指标没有关联的提醒政策,则表会提供一个创建提醒按钮。如需为指标创建提醒政策,请点击指标对应的行中的创建提醒

此时将打开提醒政策对话框,其中已填充条件字段。建议您检查所有设置并做出以下修改:

  • 更新条件阈值。默认值可能不令人满意。
  • 将通知渠道添加到政策中。
  • 为政策命名。

您还可以为任何指标创建提醒政策,方法是点击  操作,然后点击为指标创建提醒

如需了解详情,请参阅创建提醒政策

为不受监控的指标创建图表

如果表中的指标没有关联的自定义信息中心,则该表会提供一个创建图表按钮。您可以使用此按钮创建图表并将其放置在自定义信息中心内。如需为指标创建图表,请执行以下操作:

  1. 点击相应指标所在行中的创建图表

    分层图表面板会打开并经过预先配置,以显示所选指标。您可以修改图表配置。 如需详细了解如何使用 Metrics Explorer,请参阅使用 Metrics Explorer 创建图表

  2. 如需将图表保存到自定义信息中心,请点击保存到信息中心

  3. Save Chart 面板上,执行以下操作:

    1. 接受或修改图表的默认标题。
    2. 选择要将图表保存到的现有自定义信息中心,或选择 New Dashboard 为图表创建新的信息中心。
    3. 点击保存图表

使用指标

虽然您可以使用指标管理页面来查看有关指标的一些信息,但您可能需要更多信息。例如,您可能需要查看特定指标的图表,或者创建提醒政策,以便在该指标的提取率意外发生时收到通知。

如需获取有关特定指标的更多详细信息,请执行以下操作:

  1. 在 Google Cloud 控制台的导航面板中,选择 Monitoring,然后选择  指标管理

    转到指标管理

  2. 在表格中找到相应指标,然后点击  操作以执行以下任一操作:

    • 如需查看显示当前指标的图表,请选择在 Metrics Explorer 中查看

      Metrics Explorer 会打开并经过预先配置,以显示所选指标。您可以修改图表配置、舍弃配置,也可以将其添加到自定义信息中心。

    • 如需创建用于监控指标的提醒政策,请选择为指标创建提醒

      此时将打开提醒政策对话框,其中已填充条件字段。建议您检查所有设置并做出以下修改:

      • 更新条件阈值。默认值可能不令人满意。
      • 将通知渠道添加到政策中。
      • 为政策命名。

      如需了解详情,请参阅创建提醒政策

    • 如需查看与指标关联的审核日志,请选择查看指标审核日志

查看计费指标的注入情况并发出提醒

注入的计费字节数和计费样本数决定了您的大部分费用。如需预测因使用计费指标而产生的每月费用,您需要知道数据注入的速率。指标管理页面提供指标使用情况摘要,可帮助您执行以下操作:

  • 查看可计费指标的使用趋势。
  • 确定指标范围内的项目发送的指标数据数量是否超过预期。
  • 确定生成最多数据的指标。
  • 确定负责生成最多 Prometheus 数据的命名空间。
  • 查看指标中的写入错误率。错误率是返回错误状态的指标写入次数相对于指标写入总次数的百分比。

查看指标使用情况摘要

如需查看计费指标数量、指标提取率和错误率的摘要,请执行以下操作:

  1. 在 Google Cloud 控制台的导航面板中,选择 Monitoring,然后选择  指标管理

    转到指标管理

  2. 在工具栏中,选择时间窗口。默认情况下,指标管理页面会显示前一天收集的指标的相关信息。以下屏幕截图展示了一个示例:

    摘要窗格会显示指标范围内各个项目的指标使用情况。

    • 如需查看指标范围内项目中当前有多少可计费指标当前处于活动状态的摘要,请参阅活跃指标统计信息摘要。如果在过去 25 小时内写入某个指标,则该指标处于活跃状态。

    • 如需确定产生费用的因素,请使用注入的计费字节数注入的计费样本数统计信息摘要。如需了解详情,请参阅查看指标提取的总体趋势

    • 如需查找可帮助您确定计费指标的设计或使用方面的问题的信息,请使用指标写入错误数统计信息摘要。如需了解详情,请参阅调查指标的问题

指标管理页面显示您正在提取的数据量,而不是实际费用。如需查看当前的结算信息,请点击工具栏中的查看结算信息

查看指标注入的总体趋势

如需确定您的应用是否生成了稳定数量的数据(这是稳定应用的预期行为),请使用提取统计信息摘要查看收集速率。通过更改查看指标的时间范围,您可能会看到低谷、峰值或趋势。

如需查看一段时间内的收集速率,请执行以下操作:

  1. 在 Google Cloud 控制台的导航面板中,选择 Monitoring,然后选择  指标管理

    转到指标管理

  2. 在工具栏中,选择您的时间范围。
  3. 点击统计信息摘要图表上的查看图表,查看注入的字节数或样本数。 此处的讨论是指可计费样本的图表,但计费字节数的图表的工作原理相同。您会看到如下所示的一组图表:

    汇总指标提取的图表示例。

    默认情况下,图表图例处于收起状态。如需查看图表中显示的时序列表,请点击  图例。如需了解如何设置时间参考或在特定时间范围内展开图表,请参阅探索已绘制成图表的数据

例如,如果将时间范围设置为一周,并且发现提取的数据随时间而出现恒定但出乎意料的增长,则可以查看增长是来自一个特定指标,还是作为一组指标的总体趋势。如果某个指标是可信的,您可以调查一下该指标的基数是否也在增加。

  • 如需查看注入当前指标范围的计费样本数的比率,请使用注入的计费样本总数图表。

  • 如需查看指标范围内每个项目对总计费值的贡献,请使用按注入的计费样本数统计的项目数图表。此图表可以告诉您哪些项目发送的数据最多,以及是否有项目发送的数据量在增加或减少。

  • (仅限计费示例)如需查找哪些命名空间发送的指标对计费值的影响最大,请使用命名空间量提取图表。

  • 如需查看指标范围内对计费值贡献最大的指标,请使用注入的计费样本数中排名前 10 的指标图表。您可能需要查找收集率的峰值、低谷或趋势,或者查找与其他所有指标截然不同的指标。

  • 如需查看对指标范围内所有指标的可计费值的贡献,请使用所有指标(按注入的计费样本数)图表。此图表包含排名前 10 位图表中的指标,可向您展示指标中收集率的总体分布情况。

如需更详细地分析其中任何图表,请点击  更多选项,然后选择在 Metrics Explorer 中查看。如需查看以命名空间量提取图表开头并使用 Metrics Explorer 执行提取量归因的示例,请参阅以下内容:

如需详细了解如何使用 Metrics Explorer 分析数据,包括比较当月的行为与上个月的行为等操作,请参阅探索绘制成图表的数据

根据指标提取创建提醒

如需在可计费指标的指标收集率峰值、低谷或趋势时收到通知,请创建提醒政策。例如,指标集合减少可能表示应用性能不佳。同样,高峰也可能会导致意外费用。最后,上升趋势可能表示指标的标签过多或基数在增加。无论哪种情况,提醒政策都可以通知您异常行为,然后您可以解决这种情况。

如果指标按注入的字节数计费,指标按注入的样本数进行计费,则需要为这两个结算值创建提醒政策。

如需创建用于监控指标收集速率的提醒政策,请执行以下操作:

  1. 在 Google Cloud 控制台的导航面板中,选择 Monitoring,然后选择  指标管理

    转到指标管理

  2. 在工具栏中,选择您的时间范围。
  3. 点击统计信息摘要图表上的查看图表,查看注入的字节数或样本数。
  4. 在您要监控其数据的图表中,点击创建提醒政策

    此时将打开提醒政策对话框,其中已填充条件字段。建议您检查所有设置并做出以下修改:

    • 更新条件阈值。默认值可能不令人满意。
    • 将通知渠道添加到政策中。
    • 为政策命名。

    如需了解详情,请参阅创建提醒政策

调查指标存在的问题

您可以使用指标管理页面来调查可计费指标的结构或使用问题。例如,您可能会遇到以下情况:

  • 可归因于特定指标的可结算量增加。
  • 有关特定指标的查询延迟时间增加的报告。
  • 写入指标数据时出错,这可能是由于达到写入数据量或速率的限制而导致的。

写入指标数据中的错误可能与其他问题相关,例如可计费量意外增加或查询延迟时间增加。例如,更改指标配置可能会导致基数问题,该问题可能会影响提取的数据量和查询延迟时间,还可能导致指标写入错误。

查看指标写入错误

指标写入错误统计信息摘要中,您可以执行以下操作:

  • 查看指标写入请求的状态。
  • 创建提醒政策,以便在指标写入错误率超过阈值时通知您。
  • 查看审核日志中是否存在指标写入错误(如果您已启用审核日志)。您可以通过这些日志深入了解指标写入错误的原因。

如需查看写入指标数据时有关错误的信息,请执行以下操作:

  1. 在 Google Cloud 控制台的导航面板中,选择 Monitoring,然后选择  指标管理

    转到指标管理

  2. 在工具栏中,选择您的时间范围。
  3. 点击指标写入错误数统计信息摘要中的查看错误

    • 如需查看向 Cloud Monitoring API 发出的指标写入请求的状态,请使用 API - 创建时间序列(状态代码)图表。此图表显示了对 timeSeries.create 方法的调用。

      每个时序都会显示特定 HTTP 状态代码的写入速率。当图表显示 2xx 状态结果的单行时,您不存在指标写入错误。以下屏幕截图显示了 2xx 状态结果和少量 4xx 和 5xx 状态结果:

      **指标写入错误数** 图表显示写入时间序列数据的错误率。

      如果您发现指标写入请求的数量增加,则可能会遇到基数问题。

    • 如果图表显示错误的状态代码,并且您为项目启用了审核日志,则您可以使用日志调查错误的原因。针对日志的预配置查询会查找与 Monitoring API 方法 timeSeries.create 关联的错误。每次写入指标时都会调用此方法。

      timeSeries.create 错误的日志可以告诉您产生错误状态代码的原因。例如,如果您尝试一次性写入过多数据,或者活跃时序的数量超出上限,则该方法可能会失败。如需了解详情,请参阅 Monitoring 配额文档中的用户定义的指标部分。

调查指标创建错误

与可能失败的指标相关的另一种方法是 metricDescriptors.create 方法。首次为新指标写入时间序列数据时,或者如果您更改指标数据的结构(很可能是通过添加新标签),就会调用 metricDescriptors.create 方法。该方法的错误审核日志可从指标表中每个指标的条目中找到。

如需查看特定指标的审核日志,请执行以下操作:

  1. 在 Google Cloud 控制台的导航面板中,选择 Monitoring,然后选择  指标管理

    转到指标管理

  2. 在工具栏中,选择您的时间范围。
  3. 在表格中找到该指标,然后点击  操作
  4. 选择查看指标审核日志

    针对日志的预配置查询会查找与 Monitoring API 方法 metricDescriptors.create 关联的错误。

metricDescriptors.create 方法中的错误可帮助您识别指标设计中可能存在的问题。如果超出允许的指标描述符数量或指标描述符中的标签数量,此方法可能会出错。如需了解详情,请参阅 Monitoring 配额文档中的用户定义的指标部分。

后续步骤