在 AKS 关联集群上安装 Cloud Monitoring

本页面介绍了如何使用 Google Cloud Managed Service for Prometheus 为 GKE 关联的集群设置代管式数据收集。运行 Kubernetes 1.25 或更高版本的 Google Cloud 集群提供此功能。对于之前已在 Kubernetes 1.24 版集群上注册此功能预览版的客户,该集群也支持此功能。

借助此功能,您可以使用 PodMonitoring 资源来选择要提取到 Cloud Monitoring 中的指标。然后,您可以在 Google Cloud 控制台中查看这些指标。

限制

  • 此功能不适用于 1.23.0-gke.2 之前的平台版本。
  • 此功能需要 Linux 工作负载。

设置代管式数据收集

如需使用 Managed Service for Prometheus 设置代管式数据收集,请完成以下步骤:

  1. 授权 gmp-system/collectorgmp-system/rule-evaluator 服务账号写入您的指标:

      gcloud projects add-iam-policy-binding GOOGLE_PROJECT_ID \
          --member="serviceAccount:GOOGLE_PROJECT_ID.svc.id.goog[gmp-system/collector]" \
          --role=roles/monitoring.metricWriter
      gcloud projects add-iam-policy-binding GOOGLE_PROJECT_ID \
          --member="serviceAccount:GOOGLE_PROJECT_ID.svc.id.goog[gmp-system/rule-evaluator]" \
          --role=roles/monitoring.viewer
      gcloud projects add-iam-policy-binding GOOGLE_PROJECT_ID \
          --member="serviceAccount:GOOGLE_PROJECT_ID.svc.id.goog[gmp-system/rule-evaluator]" \
          --role=roles/monitoring.metricWriter
    

    GOOGLE_PROJECT_ID 替换为您的 Google Cloud 项目 ID。

    除非您的 Google Cloud 项目中至少创建了一个集群,否则添加此 IAM 绑定会失败。这是因为,其引用的工作负载身份池 GOOGLE_PROJECT_ID.svc.id.goog 不会在创建集群之前进行预配。

  2. 使用 gcloud container attached clusters register 命令来注册集群,并在命令中添加可选的 --enable-managed-prometheus 标志。

  3. 如需配置要提取的工作负载指标,请设置 PodMonitoring 资源。如需查看示例,请参阅 Managed Service for Prometheus 文档中的代管式数据收集中的配置 PodMonitoring 资源

启用 Managed Service for Prometheus 的代管式数据收集后,GKE 关联的集群会创建 gmp-system 命名空间。请勿修改或部署此命名空间中的任何内容。GKE 关联的集群还会创建 gmp-public 命名空间。Managed Service for Prometheus 使用 gmp-public 命名空间来部署 OperatorConfig 资源。

更新 Prometheus 配置

如需停用或重新启用 Prometheus 数据收集,请使用 gcloud container attached clusters update 命令。更新集群时,请添加 --disable-managed-prometheus--enable-managed-prometheus 可选标志。

后续步骤