Cloud Monitoring

本文档介绍 GKE on Azure 如何与 Cloud Monitoring 集成，以及如何查看指标。

准备工作

GKE on Azure 内置了与 Cloud Monitoring 集成的功能，可用于节点、pod 和容器的系统指标。这样，您就可以轻松查看集群中工作负载的资源消耗量、构建信息中心以及配置提醒。

GKE on Azure 会在集群中安装指标收集器 gke-metrics-agent。此代理基于 OpenTelemetry 收集器，并在集群中的每个节点上运行。它会每分钟对指标进行采样，并将测量结果上传到 Cloud Monitoring。

上传集群的指标后，它们将位于您的 Google Cloud 项目中。您可以汇总所有集群的数据、构建自定义信息中心、浏览单个集群的数据、查看折线图、设置提醒等等。

如需使用 Metrics Explorer 查看受监控资源的指标，请执行以下操作：

在 Google Cloud 控制台中，转到 Metrics Explorer 页面：
进入 Metrics Explorer

如果您使用搜索栏查找此页面，请选择子标题为监控的结果。
在指标元素中，展开选择指标菜单，在过滤栏中输入 Kubernetes Container，然后使用子菜单选择一个特定资源类型和指标：
1. 在活跃资源菜单中，选择 Kubernetes 容器。
2. 在活跃指标类别菜单中，选择 Anthos。
3. 在活跃指标菜单中，选择 CPU 使用时间。
4. 点击应用。
如需从显示结果中移除时序，请使用过滤条件元素。
如需组合时序，请使用聚合元素上的菜单。例如，如需根据虚拟机所在的可用区显示虚拟机的 CPU 利用率，请将第一个菜单设置为平均值，并将第二个菜单设置为可用区。

当聚合元素的第一个菜单设置为未聚合时，系统会显示所有时序。聚合元素的默认设置由您选择的指标类型决定。
对于配额和每天报告一个样本的其他指标，请执行以下操作：
1. 在显示窗格中，将微件类型设置为堆叠条形图。
2. 将时间段设置为至少一周。

如需使用 Metrics Explorer 查看受监控资源的指标，请执行以下操作：

在 Google Cloud 控制台中，转到 Metrics Explorer 页面：
进入 Metrics Explorer

如果您使用搜索栏查找此页面，请选择子标题为监控的结果。
在指标元素中，展开选择指标菜单，在过滤栏中输入 Kubernetes Container，然后使用子菜单选择一个特定资源类型和指标：
1. 在活跃资源菜单中，选择 Kubernetes 容器。
2. 在活跃指标类别菜单中，选择容器。
3. 在活跃指标菜单中，选择 CPU 使用时间。
4. 点击应用。
如需从显示结果中移除时序，请使用过滤条件元素。
如需组合时序，请使用聚合元素上的菜单。例如，如需根据虚拟机所在的可用区显示虚拟机的 CPU 利用率，请将第一个菜单设置为平均值，并将第二个菜单设置为可用区。

当聚合元素的第一个菜单设置为未聚合时，系统会显示所有时序。聚合元素的默认设置由您选择的指标类型决定。
对于配额和每天报告一个样本的其他指标，请执行以下操作：
1. 在显示窗格中，将微件类型设置为堆叠条形图。
2. 将时间段设置为至少一周。

使用以下三种受监控的资源类型之一收集指标。这些类型与执行测量的 Kubernetes 对象相对应：

例如，有关 Pod 的测量结果将使用受监控的资源类型 k8s_pod。因此，这些指标将包括 pod_name 和 namespace_name 的标签，用于标识特定 Pod。如果您要查看特定集群的指标，请使用以下格式：

azureClusters/CLUSTER_NAME

每个受监控的资源类型用于一组不同的指标类型。如需详细了解这些指标类型，请参阅 GKE 系统指标。