Cloud Monitoring

本文档介绍 GKE on Azure 如何与 Cloud Monitoring 集成,以及如何查看指标。

准备工作

  1. 配置 Google Cloud CLI 并在 Google Cloud 项目中启用所需的 API。

  2. 为 Cloud Logging / Cloud Monitoring 授权以设置对 Google Cloud 可观测性的权限。

概览

GKE on Azure 内置了与 Cloud Monitoring 集成的功能,可用于节点、pod 和容器的系统指标。这样,您就可以轻松查看集群中工作负载的资源消耗量、构建信息中心以及配置提醒。

GKE on Azure 会在集群中安装指标收集器 gke-metrics-agent。此代理基于 OpenTelemetry 收集器,并在集群中的每个节点上运行。它会每分钟对指标进行采样,并将测量结果上传到 Cloud Monitoring。

上传集群的指标后,它们将位于您的 Google Cloud 项目中。您可以汇总所有集群的数据、构建自定义信息中心、浏览单个集群的数据、查看折线图、设置提醒等等。

使用 Metrics Explorer

1.27 或更高版本

如需使用 Metrics Explorer 查看受监控资源的指标,请执行以下操作:

  1. 在 Google Cloud 控制台中,转到 Metrics Explorer 页面:

    进入 Metrics Explorer

    如果您使用搜索栏查找此页面,请选择子标题为监控的结果。

  2. 指标元素中,展开选择指标菜单,在过滤栏中输入 Kubernetes Container,然后使用子菜单选择一个特定资源类型和指标:
    1. 活跃资源菜单中,选择 Kubernetes 容器
    2. 活跃指标类别菜单中,选择 Anthos
    3. 活跃指标菜单中,选择 CPU 使用时间
    4. 点击应用
  3. 如需从显示结果中移除时序,请使用过滤条件元素

  4. 如需组合时序,请使用聚合元素上的菜单。例如,如需根据虚拟机所在的可用区显示虚拟机的 CPU 利用率,请将第一个菜单设置为平均值,并将第二个菜单设置为可用区

    聚合元素的第一个菜单设置为未聚合时,系统会显示所有时序。聚合元素的默认设置由您选择的指标类型决定。

  5. 对于配额和每天报告一个样本的其他指标,请执行以下操作:
    1. 显示窗格中,将微件类型设置为堆叠条形图
    2. 将时间段设置为至少一周。

1.26 或更低版本

如需使用 Metrics Explorer 查看受监控资源的指标,请执行以下操作:

  1. 在 Google Cloud 控制台中,转到 Metrics Explorer 页面:

    进入 Metrics Explorer

    如果您使用搜索栏查找此页面,请选择子标题为监控的结果。

  2. 指标元素中,展开选择指标菜单,在过滤栏中输入 Kubernetes Container,然后使用子菜单选择一个特定资源类型和指标:
    1. 活跃资源菜单中,选择 Kubernetes 容器
    2. 活跃指标类别菜单中,选择容器
    3. 活跃指标菜单中,选择 CPU 使用时间
    4. 点击应用
  3. 如需从显示结果中移除时序,请使用过滤条件元素

  4. 如需组合时序,请使用聚合元素上的菜单。例如,如需根据虚拟机所在的可用区显示虚拟机的 CPU 利用率,请将第一个菜单设置为平均值,并将第二个菜单设置为可用区

    聚合元素的第一个菜单设置为未聚合时,系统会显示所有时序。聚合元素的默认设置由您选择的指标类型决定。

  5. 对于配额和每天报告一个样本的其他指标,请执行以下操作:
    1. 显示窗格中,将微件类型设置为堆叠条形图
    2. 将时间段设置为至少一周。

指标受监控的资源类型

使用以下三种受监控的资源类型之一收集指标。这些类型与执行测量的 Kubernetes 对象相对应:

例如,有关 Pod 的测量结果将使用受监控的资源类型 k8s_pod。因此,这些指标将包括 pod_namenamespace_name 的标签,用于标识特定 Pod。 如果您要查看特定集群的指标,请使用以下格式:

azureClusters/CLUSTER_NAME

每个受监控的资源类型用于一组不同的指标类型。如需详细了解这些指标类型,请参阅 GKE 系统指标

收集哪些指标

后续步骤