本文档介绍了 GKE 关联集群如何与 Cloud Monitoring 集成,以及如何查看指标。
准备工作
满足 GKE 关联集群的前提条件。
为 Cloud Logging 和 Cloud Monitoring 授权以设置对 Google Cloud Observability 的权限。
概览
GKE 关联集群内置了与 Cloud Monitoring 集成的功能,可用于节点、pod 和容器的系统指标。这样,您就可以轻松查看集群中工作负载的资源消耗量、构建信息中心以及配置提醒。
GKE 关联集群会在集群中安装指标收集器 gke-metrics-agent
。此代理基于 OpenTelemetry 收集器,并在集群中的每个节点上运行。它会每分钟对指标进行采样,并将测量结果上传到 Cloud Monitoring。
上传集群的指标后,它们将位于您的 Google Cloud 项目中。您可以汇总所有集群的数据、构建自定义信息中心、浏览单个集群的数据、查看折线图、设置提醒等等。
使用 Metrics Explorer
如需使用 Metrics Explorer 查看受监控资源的指标,请执行以下操作:
-
在 Google Cloud 控制台中,转到 leaderboard Metrics Explorer 页面:
如果您使用搜索栏查找此页面,请选择子标题为监控的结果。
- 在指标元素中,展开选择指标菜单,在过滤栏中输入
Kubernetes Container
,然后使用子菜单选择一个特定资源类型和指标:- 在活跃资源菜单中,选择 Kubernetes 容器。
- 在活跃指标类别菜单中,选择 Anthos。
- 在活跃指标菜单中,选择 CPU 使用时间。
- 点击应用。
如需从显示结果中移除时序,请使用过滤条件元素。
如需组合时序,请使用聚合元素上的菜单。例如,如需根据虚拟机所在的可用区显示虚拟机的 CPU 利用率,请将第一个菜单设置为平均值,并将第二个菜单设置为可用区。
当聚合元素的第一个菜单设置为未聚合时,系统会显示所有时序。聚合元素的默认设置由您选择的指标类型决定。
- 对于配额和每天报告一个样本的其他指标,请执行以下操作:
- 在显示窗格中,将微件类型设置为堆叠条形图。
- 将时间段设置为至少一周。
指标受监控的资源类型
使用以下三种受监控的资源类型之一收集指标。这些类型与执行测量的 Kubernetes 对象相对应:
例如,有关 Pod 的测量结果将使用受监控的资源类型 k8s_pod
。因此,这些指标将包括 pod_name
和 namespace_name
的标签,用于标识特定 Pod。 如果您要查看特定集群的指标,请使用以下格式:
attachedClusters/CLUSTER_NAME
每个受监控的资源类型用于一组不同的指标类型。如需详细了解这些指标类型,请参阅 GKE 系统指标。
收集哪些指标
- v1.29.0-gke.1
- v1.28.0-gke.4
- v1.28.0-gke.3
- v1.28.0-gke.2
- v1.28.0-gke.1
- v1.27.0-gke.7
- v1.27.0-gke.6
- v1.27.0-gke.5
- v1.27.0-gke.4
- v1.27.0-gke.3
- v1.27.0-gke.2
- v1.27.0-gke.1
- v1.26.0-gke.9
- v1.26.0-gke.8
- v1.26.0-gke.7
- v1.26.0-gke.6
- v1.26.0-gke.5
- v1.26.0-gke.4
- v1.26.0-gke.3
- v1.26.0-gke.2
- v1.26.0-gke.1
- v1.25.0-gke.8
- v1.25.0-gke.7
- v1.25.0-gke.6
- v1.25.0-gke.5
- v1.25.0-gke.4
- v1.25.0-gke.3
- v1.25.0-gke.2
- v1.25.0-gke.1
- v1.24.0-gke.5
- v1.24.0-gke.4
- v1.24.0-gke.3
- v1.24.0-gke.2
- v1.24.0-gke.1
- v1.23.0-gke.3
- v1.23.0-gke.2
- v1.23.0-gke.1
- v1.22.0-gke.1
- v1.21.0-gke.1
后续步骤
- 使用 Managed Service for Prometheus 设置代管式数据收集
- 使用 Metrics Explorer
- 创建基于日志的指标
- 构建 Cloud Monitoring 查询
- 设置提醒
- GKE Enterprise 概览