在 EKS 关联集群上安装 Cloud Monitoring

本文档介绍了 GKE 关联集群如何与 Cloud Monitoring 集成,以及如何查看您的指标。

准备工作

  1. 满足 GKE 关联集群的前提条件

  2. 授权 Cloud Logging 和 Cloud Monitoring 为 Google Cloud 可观测性设置权限。

概览

GKE 关联集群内置了与 Cloud Monitoring 集成的功能,可用于节点、pod 和容器的系统指标。这样,您就可以轻松查看集群中工作负载的资源消耗量、构建信息中心以及配置提醒。

GKE 关联集群会在集群中安装指标收集器 gke-metrics-agent。此代理基于 OpenTelemetry 收集器,并在集群中的每个节点上运行。它会每分钟对指标进行采样,并将测量结果上传到 Cloud Monitoring。

上传集群的指标后,它们将位于您的 Google Cloud 项目中。您可以汇总所有集群的数据、构建自定义信息中心、浏览单个集群的数据、查看折线图、设置提醒等等。

使用 Metrics Explorer

如需使用 Metrics Explorer 查看受监控资源的指标,请执行以下操作:

  1. 在 Google Cloud 控制台的导航面板中,选择 Monitoring,然后选择  Metrics Explorer

    进入 Metrics Explorer

  2. 指标元素中,展开选择指标菜单,在过滤栏中输入 Kubernetes Container,然后使用子菜单选择一个特定资源类型和指标:
    1. 活跃资源菜单中,选择 Kubernetes 容器
    2. 活跃指标类别菜单中,选择 Anthos
    3. 活跃指标菜单中,选择 CPU 使用时间
    4. 点击应用
  3. 如需从显示结果中移除时序,请使用过滤条件元素

  4. 如需组合时序,请使用聚合元素上的菜单。例如,如需根据虚拟机所在的可用区显示虚拟机的 CPU 利用率,请将第一个菜单设置为平均值,并将第二个菜单设置为可用区

    聚合元素的第一个菜单设置为未聚合时,系统会显示所有时序。聚合元素的默认设置由您选择的指标类型决定。

  5. 对于配额和每天报告一个样本的其他指标,请执行以下操作:
    1. 显示窗格中,将微件类型设置为堆叠条形图
    2. 将时间段设置为至少一周。

指标受监控的资源类型

使用以下三种受监控的资源类型之一收集指标。这些类型与执行测量的 Kubernetes 对象相对应:

例如,有关 Pod 的测量将使用受监控的资源类型 k8s_pod。因此,这些指标将包括 pod_namenamespace_name 的标签,它们用于标识特定 Pod。如果要查看特定集群的指标,请使用以下格式:

attachedClusters/CLUSTER_NAME

每个受监控的资源类型用于一组不同的指标类型。如需详细了解这些指标类型,请参阅 GKE 系统指标

收集哪些指标

后续步骤