本文档介绍 GKE on AWS 如何与 Cloud Monitoring 集成,以及如何查看指标。
准备工作
配置 Google Cloud CLI 并在 Google Cloud 项目中启用所需的 API。
为 Cloud Logging / Cloud Monitoring 授权以设置对 Google Cloud 可观测性的权限。
概览
GKE on AWS 内置了与 Cloud Monitoring 集成的功能,可用于节点、pod 和容器的系统指标。这样,您就可以轻松查看集群中工作负载的资源消耗量、构建信息中心以及配置提醒。
GKE on AWS 会在集群中安装指标收集器 gke-metrics-agent
。此代理基于 OpenTelemetry 收集器,并在集群中的每个节点上运行。它会每分钟对指标进行采样,并将测量结果上传到 Cloud Monitoring。
上传集群的指标后,它们将位于您的 Google Cloud 项目中。您可以汇总所有集群的数据、构建自定义信息中心、浏览单个集群的数据、查看折线图、设置提醒等等。
使用 Metrics Explorer
1.27 或更高版本
如需使用 Metrics Explorer 查看受监控资源的指标,请执行以下操作:
-
在 Google Cloud 控制台中,转到 leaderboard Metrics Explorer 页面:
如果您使用搜索栏查找此页面,请选择子标题为监控的结果。
- 在指标元素中,展开选择指标菜单,在过滤栏中输入
Kubernetes Container
,然后使用子菜单选择一个特定资源类型和指标:- 在活跃资源菜单中,选择 Kubernetes 容器。
- 在活跃指标类别菜单中,选择 Anthos。
- 在活跃指标菜单中,选择 CPU 使用时间。
- 点击应用。
如需从显示结果中移除时序,请使用过滤条件元素。
如需组合时序,请使用聚合元素上的菜单。例如,如需根据虚拟机所在的可用区显示虚拟机的 CPU 利用率,请将第一个菜单设置为平均值,并将第二个菜单设置为可用区。
当聚合元素的第一个菜单设置为未聚合时,系统会显示所有时序。聚合元素的默认设置由您选择的指标类型决定。
- 对于配额和每天报告一个样本的其他指标,请执行以下操作:
- 在显示窗格中,将微件类型设置为堆叠条形图。
- 将时间段设置为至少一周。
1.26 或更低版本
如需使用 Metrics Explorer 查看受监控资源的指标,请执行以下操作:
-
在 Google Cloud 控制台中,转到 leaderboard Metrics Explorer 页面:
如果您使用搜索栏查找此页面,请选择子标题为监控的结果。
- 在指标元素中,展开选择指标菜单,在过滤栏中输入
Kubernetes Container
,然后使用子菜单选择一个特定资源类型和指标:- 在活跃资源菜单中,选择 Kubernetes 容器。
- 在活跃指标类别菜单中,选择容器。
- 在活跃指标菜单中,选择 CPU 使用时间。
- 点击应用。
如需从显示结果中移除时序,请使用过滤条件元素。
如需组合时序,请使用聚合元素上的菜单。例如,如需根据虚拟机所在的可用区显示虚拟机的 CPU 利用率,请将第一个菜单设置为平均值,并将第二个菜单设置为可用区。
当聚合元素的第一个菜单设置为未聚合时,系统会显示所有时序。聚合元素的默认设置由您选择的指标类型决定。
- 对于配额和每天报告一个样本的其他指标,请执行以下操作:
- 在显示窗格中,将微件类型设置为堆叠条形图。
- 将时间段设置为至少一周。
指标受监控的资源类型
使用以下三种受监控的资源类型之一收集指标。这些类型与执行测量的 Kubernetes 对象相对应:
例如,有关 Pod 的测量结果将使用受监控的资源类型 k8s_pod
。因此,这些指标将包括 pod_name
和 namespace_name
的标签,用于标识特定 Pod。 如果您要查看特定集群的指标,请使用以下格式:
awsClusters/CLUSTER_NAME
每个受监控的资源类型用于一组不同的指标类型。如需详细了解这些指标类型,请参阅 GKE 系统指标。
收集哪些指标
- v1.29.3-gke.600
- v1.28.8-gke.800
- v1.28.7-gke.1700
- v1.28.5-gke.1200
- v1.28.5-gke.100
- v1.28.3-gke.700
- v1.27.12-gke.800
- v1.27.11-gke.1600
- v1.27.10-gke.500
- v1.27.9-gke.100
- v1.27.7-gke.600
- v1.27.6-gke.700
- v1.27.5-gke.200
- v1.27.4-gke.1600
- v1.26.14-gke.1500
- v1.26.13-gke.400
- v1.26.12-gke.100
- v1.26.10-gke.600
- v1.26.9-gke.700
- v1.26.8-gke.200
- v1.26.7-gke.500
- v1.26.5-gke.1400
- v1.26.5-gke.1200
- v1.26.4-gke.2200
- v1.26.2-gke.1001
- v1.25.14-gke.700
- v1.25.13-gke.200
- v1.25.12-gke.500
- v1.25.10-gke.1400
- v1.25.10-gke.1200
- v1.25.8-gke.500
- v1.25.7-gke.1000
- v1.25.6-gke.1600
- v1.25.5-gke.2000
- v1.25.5-gke.1500
- v1.25.4-gke.1300
- v1.24.14-gke.2700
- v1.24.14-gke.1400
- v1.24.13-gke.500
- v1.24.11-gke.1000
- v1.24.10-gke.1200
- v1.24.9-gke.2000
- v1.24.9-gke.1500
- v1.24.8-gke.1300
- v1.24.5-gke.200
- v1.24.3-gke.2200
- v1.24.3-gke.2100
- v1.23.16-gke.2800
- v1.23.16-gke.200
- v1.23.14-gke.1800
- v1.23.14-gke.1100
- v1.23.11-gke.300
- v1.23.9-gke.2200
- v1.23.9-gke.2100
- v1.23.9-gke.800
- v1.23.8-gke.1700
- v1.23.7-gke.1300
- v1.22.15-gke.100
- v1.22.12-gke.2300
- v1.22.12-gke.1100
- v1.22.12-gke.200
- v1.22.10-gke.1500
- v1.22.8-gke.2100
- v1.22.8-gke.1300
- v1.22.8-gke.200
- v1.21.14-gke.2900
- v1.21.14-gke.2100
- v1.21.11-gke.1900
- v1.21.11-gke.1800
- v1.21.11-gke.1100
- v1.21.11-gke.100
- v1.21.6-gke.1500
- v1.21.5-gke.2800
后续步骤
- 使用 Managed Service for Prometheus 设置代管式数据收集
- 使用 Metrics Explorer
- 创建基于日志的指标
- 构建 Cloud Monitoring 查询
- 设置提醒
- GKE Enterprise 概览