为信息中心内的图表选择指标

本文档介绍了如何在自定义信息中心内配置图表,以显示项目收集的时间序列数据。图表只能显示数字时间序列数据。如需了解如何配置图表的样式,请参阅设置图表显示选项

选择要显示的数据

如需配置要在图表上显示的时序,您可以通过从菜单中进行选择来构建查询,也可以编写查询。编写查询时,选择查询语言,然后使用查询编辑器或基于文本的界面:

  • Monitoring Query Language (MQL) 查询指定时序以及这些时序的分组和匹配方式。MQL 接口支持带有建议和语法检查的代码编辑器。

    通常,无法将 MQL 查询转换为其他接口可以使用的形式。当您切换到或离开 MQL 标签页时,未保存的查询会被舍弃。

  • Prometheus 查询语言 (PromQL) 查询会指定时序以及这些时序的分组和匹配方式。PromQL 接口支持带有建议的编辑器。

    通常,无法将 PromQL 查询转换为其他接口可以使用的形式。当您切换到“PromQL”标签页或从“PromQL”标签页切换时,系统将舍弃未保存的查询。

  • 监控过滤条件查询可指定时序,但不包括分组或校准语句。

    可以使用 Monitoring 过滤条件指定 Monitoring 可以绘制图表的任何时序。例如,如需为虚拟机上运行的进程数绘制图表,您必须使用指定函数的 Monitoring 过滤条件。

    有时无法将 Monitoring 过滤条件转换为其他接口所需的形式。因此,如果您切换到其他接口,您的查询可能会被舍弃。

查询通常指定指标类型、资源类型和过滤条件:

  • 指标类型用于标识要从资源中收集的测量值。指标类型包括对要测量的内容以及如何解释测量结果的说明。“指标类型”有时称为“指标”。指标的一个示例是“CPU 利用率”。 如需了解概念性信息,请参阅指标类型

  • 资源类型指定从哪种资源捕获指标数据。资源类型有时称为受监控的资源类型或资源。“Compute Engine 虚拟机 (VM) 实例”就是一个资源示例。 如需了解概念性信息,请参阅受监控的资源

MQL 和 PromQL 查询都包含分组和对齐语句。但是,在编写 Monitoring 过滤条件或使用菜单选择要绘制成图表的时序时,您可以使用菜单配置分组和校准设置。

使用菜单构建查询

使用菜单构建查询是默认配置。通常,如果您选择指标和过滤条件,然后切换到其他界面,系统会针对该界面保留您的选择并重新设置格式。也就是说,可以将由菜单构造的查询转换为 MQL 查询。

您可以选择 Builder,从其他界面返回到菜单驱动的界面。不过,系统会舍弃您的查询。 也就是说,MQL 查询无法转换为以菜单驱动的等效形式。

如需使用菜单构建查询,请执行以下操作:

  1. 在 Google Cloud 控制台的导航面板中,选择 Monitoring,然后选择  信息中心

    前往信息中心

  2. 执行下列其中一项操作:

    • 如需创建新的信息中心,请选择创建信息中心
    • 如需更新现有信息中心,请在信息中心列表中找到该信息中心,然后选择其名称。
  3. 在工具栏中,点击  添加微件

  4. 添加微件对话框中,选择  指标

  5. 在查询窗格的工具栏中,执行以下操作:

    1. 指标元素中,展开选择指标菜单。

      选择指标菜单包含一些功能,可帮助您查找可用的指标类型:

      • 如需查找特定的指标类型,请使用 过滤栏。例如,如果您输入 util,则会限制菜单显示包含 util 的条目。条目在通过不区分大小写的“包含”测试后即会显示。

      • 如需显示所有指标类型,包括没有数据的指标类型,请点击 活跃。默认情况下,这些菜单仅显示包含数据的指标类型。

    2. 资源菜单、指标类别菜单和指标菜单中进行选择,然后点击应用

      举例来说,如需绘制 Compute Engine 虚拟机的 CPU 利用率图表,您可以选择虚拟机实例实例CPU 利用率,然后点击应用

      资源菜单列出了从中收集数据的资源。如果未针对资源写入指标,请选择未指定

    完成上一步后,图表会显示可用的时序:

    显示已选择指标的图表。

    上一个图表包含的数据过多,无法显示;图表最多只能显示 50 条线条。图表会提醒数据太多,无法显示。如需减少数据量,请使用排序和限制元素中的字段。如需了解详情,请参阅显示离群值

    您还可以使用过滤和聚合选项来减少图表数据量。这些方法使图表对诊断和分析更有用,并且提高了界面本身的性能和响应速度。

  6. 可选:添加过滤条件以限制显示的时序。下一部分将介绍过滤选项。

  7. 可选:配置时序的分组和校准方式。如需了解详情,请参阅选择如何显示已绘制成图表的数据

  8. 如需将更改应用于信息中心,请在工具栏中点击 Apply。如需舍弃更改,请点击取消

过滤已绘制成图表的数据

过滤条件可确保仅将符合某些条件的时序绘制成图表。应用过滤条件时,您可以减少图表上的行数,从而提升图表的性能。提高图表响应能力的另一种方法是配置聚合选项,以及对显示的时序数量进行排序和限制。如需了解详情,请参阅显示离群值

过滤条件由标签、比较运算符和值组成。例如,如需匹配 zone 标签以 "us-central1" 开头的所有时序,您可以使用过滤条件 zone=~"us-central1.*",该过滤条件使用正则表达式执行比较。比较运算符有四种:

  • 等于、=
  • 不等于,!=
  • 正则表达式匹配,=~
  • 正则表达式不匹配,!=~

按项目 ID 或资源容器过滤时,必须使用等号运算符 (=)。按其他标签过滤时,您可以使用任何受支持的比较运算符。通常,您可以按资源组过滤指标和资源标签。

当您提供多个过滤条件时,相应图表仅显示满足所有条件的时序(逻辑 AND)。

如需在使用 Google Cloud 控制台的菜单驱动型界面时添加过滤条件,请执行以下操作:

  1. 过滤条件元素中,点击添加过滤条件,然后从菜单中进行选择。

  2. 如需更改比较项,请从比较条件菜单中选择一个值。

  3. Value(值)字段中,输入或选择一个值:

    • 如需直接比较 =!=,请从菜单中选择相应的值或输入一个值,然后点击 Ok。您可以输入值(如 us-central1-a),也可以创建以 starts_withends_with 开头的过滤字符串。例如,如需显示任何 us-central1 可用区的数据,您可以输入过滤条件字符串 starts_with("us-central1")。如需详细了解过滤字符串,请参阅 Monitoring 过滤条件

      由于菜单项源自收到的时序,因此当受监控的资源没有为所选指标生成数据时,您必须为标签输入一个值。

    • 对于正则表达式比较(=~!=~),请在字段中输入 RE2 正则表达式,然后点击确定。例如,正则表达式 us-central1-.* 可与所有 us-central1 区域匹配:

      如需匹配以“a”结尾的任何美国可用区,您可以使用正则表达式 ^us.*.a$

      注意:您不能使用正则表达式来过滤 project_id 资源标签。

      例如,如需仅查看来自其中一个 us-central1 区域的时序,请应用 zone=~"us-central1.*" 过滤条件。

当您添加多个过滤条件时,请注意以下几点:

  • 您可以多次使用同一标签,从而为一系列值指定过滤条件。

  • 必须满足所有过滤条件;它们共同构成逻辑 AND

如需修改过滤器的值或比较运算符,请在过滤器元素上点击 菜单,进行更改,然后点击确定

要删除过滤条件,请点击 取消

编写 MQL 查询

如需输入 MQL 或 PromQL 查询,请执行以下操作:

  1. 在 Google Cloud 控制台的导航面板中,选择 Monitoring,然后选择  信息中心

    前往信息中心

  2. 执行下列其中一项操作:

    • 如需创建新的信息中心,请选择创建信息中心
    • 如需更新现有信息中心,请在所有信息中心列表中找到该信息中心,然后选择其名称。
  3. 在工具栏中,点击  添加微件

  4. 添加微件对话框中,选择  指标

  5. 在查询构建器窗格的工具栏中,选择名为  MQL PromQL 的按钮。

  6. 验证已在语言切换开关中选择 MQL。语言切换开关位于同一工具栏中,用于设置查询的格式。

  7. 可选:停用自动运行切换开关。

  8. 在查询编辑器中输入查询。例如,如需绘制 Google Cloud 项目中虚拟机实例的 CPU 利用率图表,请使用以下查询:

    fetch gce_instance
    | metric 'compute.googleapis.com/instance/cpu/utilization'
    | group_by 1m, [value_utilization_mean: mean(value.utilization)]
    | every 1m
    

    如需详细了解 MQL,请参阅以下文档:

  9. 点击运行查询

    启用自动运行切换开关后,系统不会显示运行查询按钮。

编写 PromQL 查询

如需输入 MQL 或 PromQL 查询,请执行以下操作:

  1. 在 Google Cloud 控制台的导航面板中,选择 Monitoring,然后选择  信息中心

    前往信息中心

  2. 执行下列其中一项操作:

    • 如需创建新的信息中心,请选择创建信息中心
    • 如需更新现有信息中心,请在所有信息中心列表中找到该信息中心,然后选择其名称。
  3. 在工具栏中,点击  添加微件

  4. 添加微件对话框中,选择  指标

  5. 在查询构建器窗格的工具栏中,选择名为  MQL PromQL 的按钮。

  6. 验证已在语言切换开关中选择 PromQL。语言切换开关位于同一工具栏中,用于设置查询的格式。

  7. 可选:停用自动运行切换开关。

  8. 在查询编辑器中输入查询。例如,如需绘制 Google Cloud 项目中虚拟机实例的平均 CPU 利用率图表,请使用以下查询:

    avg(compute_googleapis_com:instance_cpu_utilization)
    

    如需详细了解如何使用 PromQL,请参阅 Cloud Monitoring 中的 PromQL

  9. 点击运行查询

    启用自动运行切换开关后,系统不会显示运行查询按钮。

编写 Monitoring-filter 查询

如果要执行以下操作,则必须使用直接过滤模式,该模式允许您输入 Monitoring 过滤条件

  • 显示服务等级目标 (SLO)。
  • 显示虚拟机 (VM) 上运行的进程数量。
  • 显示您尚无相关数据的自定义指标。
  • 根据您尚无数据的标签过滤时序。

Monitoring 过滤条件(或等效的指标过滤条件)是 Monitoring 用来标识要绘制图表的时序的表达式。例如,以下表达式生成的图表会显示名称包含 nginx 的进程计数:

select_process_count("monitoring.regex.full_match(\".*nginx.*\")")
resource.type="gce_instance"

您还可以使用 Monitoring 过滤条件按资源和指标类型识别时序。以下表达式生成的图表会显示 us-east1-b 地区中所有 Google Cloud 虚拟机实例的日志条目数:

metric.type="logging.googleapis.com/log_entry_count"
resource.type="gce_instance"
resource.label."zone"="us-east1-b"

要输入 Monitoring 过滤条件,请执行以下操作:

  1. 在 Google Cloud 控制台的导航面板中,选择 Monitoring,然后选择  信息中心

    前往信息中心

  2. 执行下列其中一项操作:

    • 如需创建新的信息中心,请选择创建信息中心
    • 如需更新现有信息中心,请在信息中心列表中找到该信息中心,然后选择其名称。
  3. 在工具栏中,点击  添加微件

  4. 添加微件对话框中,选择  指标

  5. 点击指标元素上的 帮助,然后选择直接过滤模式

    系统会删除 MetricFilter 元素,并创建一个 Filters 元素(可让您输入文本)。

    如果您在切换到直接过滤模式之前选择了资源类型、指标或过滤条件,则这些设置会显示在过滤条件元素中。

  6. Filters 元素的文本区域中,输入 Monitoring 过滤条件表达式。 如需了解语法信息,请参阅以下文档:

    当您使用直接过滤模式时,如果没有符合过滤条件的数据,系统就会显示错误。常见的错误消息包括 Chart definition invalidNo data is available for the selected timeframe.

  7. 可选:配置时序的分组和校准方式。如需了解详情,请参阅选择如何显示已绘制成图表的数据

如需返回菜单驱动型界面,请点击 退出直接过滤模式

选择如何显示已绘制成图表的数据

选择时序数据后,下一步是确定该数据的显示方式。例如,您想要显示每个时序,还是想将时序组合在一起?

本部分介绍了如何设置汇总字段。聚合包括校准时序中的数据点,以及将不同的时序组合在一起。如需详细了解聚合,请参阅过滤和聚合:处理时序

如果您已使用 MQL 或 PromQL 选择要用于绘制图表的数据,则本节内容不适用。

合并时序

您可以通过组合不同的时序来减少为指标返回的数据量。如需组合多个时序,您通常需要指定一个或多个标签和一个函数。系统会对所有指定标签具有相同值的时序进行分组,然后您指定的函数将这些时序组合为新的时序。

Aggregation 元素中的设置可以更改图表显示的时序数量。此元素的默认设置由您选择的指标类型决定。如需修改显示设置,请执行以下任一操作:

  • 如需显示每个时序,请在 Aggregation 元素中确保第一个菜单设置为 Unaggregated,将第二个菜单设置为 None

  • 如需组合时序,请在 Aggregation 元素中执行以下操作:

    1. 展开第一个菜单并选择一个函数。

      系统会刷新图表,并显示单个时序。例如,如果您选择平均值,则显示的时序是所有时序的平均值。

    2. 如需组合具有相同标签值的时序,请展开第二个菜单,然后选择一个或多个标签。

      系统会刷新图表,并针对标签值的每个唯一组合显示一个时序。例如,如需按时区显示时序,请将第二个菜单设置为 zone

  • 如需配置数据点之间的间距,请点击 添加查询元素,选择最小间隔,然后输入值。

例如,如果将函数设置为 Sum 并选择标签 user_labels.version,则标签 user_labels.version 的每个值都有一个时序。每个时序中的数据点根据特定版本的各个时序的所有值的总和计算得出:

当前显示的是按 user_labels.version 分组的时序。

当您选择多个标签时,系统会合并所选标签具有相同值的时序。生成的图表显示每个标签组合的一个时序。指定标签的顺序无关紧要。以下屏幕截图展示了按 user_labels.versionsystem_labels.machine_image 标签合并时序的图表:

按版本和机器映像显示时序。

如图所示,该图表为每对标签值显示一个时序。每个标签组合都会获得一个时序,这一事实意味着,这种方法创建的数据可能比存放在单个图表上的数据更多。

显示所有时序

如需显示所有时序,请在 Aggregation 元素中将第一个菜单设置为 Unaggregated,将第二个菜单设置为 None

校准数据

校准是将 Monitoring 接收到的时序数据转换为在固定时间间隔内具有数据点的新时序的过程。校准过程包括收集在固定时间段内收到的所有数据点、应用函数以组合这些数据点,以及为结果分配时间戳。该函数可能会计算所有样本的平均值,或者提取所有样本的最大值。

设置校准间隔

如需指定用于组合的点的固定时长,请点击查询窗格中的 Add query 元素中,选择 Min Interval,然后完成对话框。

例如,假设某个指标的采样周期为一分钟。如果图表配置为显示 1 小时的数据,则图表可以显示全部 60 个数据点。如果最小间隔字段设置为 10 minutes,则图表会显示 6 个数据点。但是,如果您现在将图表配置为显示一周的数据,则图表中无法显示的数据点过多,因此合并数据点的时间间隔会自动修改。在本示例中,修改间隔为一小时。

以下屏幕截图说明了特定 Google Cloud 项目中 Compute Engine 虚拟机实例的 CPU 利用率。在此图片中,最小间隔字段设置为 1 minute

使用默认校准设置的虚拟机实例的 CPU 利用率。

为便于比较,以下屏幕截图说明了将间隔从 1 minute 更改为 5 minutes 的效果:

使用默认设置且校准时间段为 5 分钟的虚拟机实例的 CPU 利用率。

通过增加此时间段,生成的图表的点数会减少,每个时序的 60 点数将减少到每个时序 10 个点。通过增加 Min Interval 字段,可合并更多数据点,从而对绘制的数据产生平滑效果。

设置对齐函数

当您选择聚合函数时,Cloud Monitoring 会为您选择校准函数。Cloud Monitoring 会根据您选择的指标类型和您为聚合函数选择的指标确定最佳校准函数。不过,您可以指定校准函数并替换 Cloud Monitoring 做出的选择。

如需指定校准函数,请执行以下操作:

  1. Aggregation 元素中,展开第一个菜单,然后选择 Configure Aligner。添加了对齐函数分组元素。
  2. 展开对齐函数元素并做出选择。

虽然大多数支持的对齐函数执行常见的数学函数,但也有一些执行更复杂的操作:

  • 下一个较旧:若要仅保留校准时间段内的最新样本,请选择下一个较旧的。此函数通常用于拨测,如果您只关注最新值,则这是一个不错的选择。

    此函数仅对刻度盘指标有效。

  • 百分位:要在折线图、堆叠面积图或堆叠条形图上显示分布指标,您必须选择要显示分布中的哪个百分位。指定此百分位的一种方法是选择百分位函数。您可以选择第 5、第 50、第 95 和第 99 百分位。使用校准时间段内的所有数据点来计算指定的百分位,从而确定校准数据点。

    此函数仅对采样平均值指标和增量指标具有分布数据类型有效。

  • delta:要将累积指标或增量指标转换为增量指标(每个校准时间段都有一个样本),请使用此函数。使用此函数时,可能会发生数据插值。如需查看示例,请参阅种类、类型和转换

    此函数仅对累计指标和增量指标有效。

  • rate:要将累积指标或增量指标转换为刻度盘指标,请使用此函数。如果选择此函数,可以将要转换的时序视为使用增量函数,然后除以校准时间段。例如,如果原始时序的单位为 MiB,校准时间段的单位为秒,则图表的单位为 MiB/秒。如需了解详情,请参阅种类、类型和转换

    此函数仅对累计指标和增量指标有效。

如需详细了解可用的校准函数,请参阅 API 参考文档中的 Aligner

二次聚合

如果您有多个已经表示聚合的时序,则可以通过选择二次聚合器将图表上的所有时序减少为单个时序。例如,如果按可用区对数据进行分组,则图表会针对每个可用区显示一个时序。如需创建包含单个时序的图表,请使用二次聚合字段。

对于某些指标类型,您可以选择转换数据。如果此选项可用,并且您将 Transform 字段设置为 None 以外的值,则其他所有字段均为二次聚合设置。

如果二次聚合字段可配置,若要访问这些字段,请执行以下操作:

  1. 点击 添加查询元素,然后选择二次聚合
  2. 配置二次聚合元素。

后续步骤