使用预定义信息中心

本文档介绍可用于 Google Distributed Cloud 的预定义监控信息中心。您还可以找到相关信息和资源的链接,可帮助您使用信息中心。

Cloud Monitoring 提供了一组精选的信息中心,专门用于各种 Google Cloud 服务。这些信息中心上的图表提供一系列与特定服务相关的指标。当检测到给定服务(如 GKE Enterprise)时,系统会自动安装这些信息中心。

预定义信息中心

当 Cloud Monitoring 检测到 GKE Enterprise 指标 kubernetes.io/anthos/container/uptime 可用时,它会使预定义的 GKE Enterprise 信息中心在您的项目中可用。创建 GKE 集群时,此指标默认可用,因此信息中心会自动安装。系统会添加以下预定义信息中心:

信息中心名称 说明
Anthos 集群控制平面正常运行时间 此信息中心包含以下图表,用于指示控制平面组件的正常运行时间:
  • API 服务器正常运行时间
  • 调度器正常运行时间
  • 控制器管理器正常运行时间
  • ETCD 正常运行时间
Anthos 集群节点状态 此信息中心包含以下图表,用于指示集群节点的状态:
  • 节点条件
  • CPU 使用率
  • 可分配的 CPU 核心数量
  • 可分配 CPU 利用率
  • 内存用量
  • 可分配的内存
  • 可分配内存利用率
  • 可用的文件系统大小
Anthos 集群 Pod 状态 此信息中心包含以下图表,用于指示集群中运行的 pod 的状态:
  • 每个容器的重启次数
  • 每个容器的容器内存用量
  • 每个容器的容器 CPU 使用率
  • 每个 Pod 的网络入站流量(字节数)
  • 每个 Pod 的网络出站流量(字节数)
  • Pod 阶段
  • Kubernetes 容器 - 内存请求利用率
  • Kubernetes 容器 - 内存限额利用率
  • Kubernetes 容器 - CPU 请求利用率
  • Kubernetes 容器 - CPU 限额利用率
  • Kubernetes Pod - 卷利用率
Anthos Clusters on VMware 虚拟机状态 此信息中心包含以下图表,用于指示 VMware 虚拟机的健康状况:
  • 每个 vCPU 的 CPU 就绪状态(百分比)
  • 内存页面故障延迟状况(百分比)
  • 平均虚拟磁盘读取延迟时间(秒)
  • 平均虚拟磁盘写入延迟时间(秒)
Anthos 集群利用率计量 此信息中心包含以下图表,用于指示每个集群的 CPU、内存和临时存储空间的请求和消耗状况:
  • Kubernetes 容器 - 请求核心数量[总和]
  • Kubernetes 容器 - CPU 使用时间[总和]
  • Kubernetes 容器 - 内存请求[总和]
  • Kubernetes 容器 - 内存用量[总和]
  • Kubernetes 容器 - 临时存储空间请求[总和]
  • Kubernetes 容器 - 临时存储空间用量[总和]

如需详细了解预定义信息中心,请参阅信息中心和图表。如需了解如何查看和使用信息中心,请参阅查看 Google Cloud 信息中心

“集成”页面

从 GKE Enterprise 版本 1.15.0 开始,Cloud Monitoring 集成页面将提供全新的 GKE Enterprise 集成。如果您已安装 GKE 集群或已在 Google Cloud 上设置 GKE Enterprise,则会看到此集成。GKE Enterprise 集成包含有关预定义 GKE Enterprise 信息中心的信息(包括预览):

  • Anthos 集群控制平面正常运行时间
  • Anthos 集群节点状态
  • Anthos 集群 Pod 状态
  • Anthos Clusters on VMware 虚拟机状态
  • Anthos 集群利用率计量

如上一部分所述,当您拥有 GKE Enterprise 集群时,系统会自动安装这些信息中心。您无法直接修改这些信息中心,因为它们完全由 Google 管理。不过,您可以创建信息中心的副本并自定义该复制的版本,也可以从示例库将这些信息中心添加为自定义信息中心

旧版集群的信息中心

如果您使用较早版本的 Google Distributed Cloud 创建集群,则可能会使用过时的信息中心。从 Google Distributed Cloud 1.16.0 版开始,将弃用以下自定义信息中心:

  • GKE On-Prem 节点状态
  • GKE On-Prem 控制平面正常运行时间
  • GKE On-Prem Pod 状态
  • GKE On-Prem vSphere 虚拟机健康状况
  • 如果您使用 Google Distributed Cloud 1.15.0 或更低版本创建集群,系统会自动安装这些信息中心。

    我们建议您按照删除自定义信息中心中所述移除这些已弃用的信息中心。

    如需详细了解信息中心(包括如何安装和使用),请参阅 Google Cloud Observability 文档中的信息中心和图表