使用预定义信息中心

本文档介绍 Google Distributed Cloud 可用的预定义监控信息中心。您还可以找到相关信息和资源的链接,可帮助您使用信息中心。

Cloud Monitoring 提供了一组精选的信息中心,专门用于各种 Google Cloud 服务。这些信息中心上的图表提供一系列与特定服务相关的指标。检测到给定服务(例如 GKE Enterprise)时,系统会自动安装这些信息中心。

预定义信息中心

当 Cloud Monitoring 检测到 GKE Enterprise 指标 kubernetes.io/anthos/container/uptime 可用时,便会在项目中提供预定义的 GKE Enterprise 信息中心。创建 GKE 集群时,此指标默认可用,因此信息中心会自动安装。系统会添加以下预定义信息中心:

信息中心名称 说明
Anthos 集群控制平面正常运行时间 此信息中心包含以下图表,用于指示控制平面组件的正常运行时间:
  • API 服务器正常运行时间
  • 调度器正常运行时间
  • 控制器管理器正常运行时间
  • ETCD 正常运行时间
Anthos 集群节点状态 此信息中心包含以下图表,用于指示集群节点的状态:
  • 节点条件
  • CPU 使用率
  • 可分配的 CPU 核心数量
  • 可分配 CPU 利用率
  • 内存用量
  • 可分配的内存
  • 可分配内存利用率
  • 可用的文件系统大小
Anthos 集群 Pod 状态 此信息中心包含以下图表,用于指示集群中运行的 pod 的状态:
  • 每个容器的重启次数
  • 每个容器的容器内存用量
  • 每个容器的容器 CPU 使用率
  • 每个 Pod 的网络入站流量(字节数)
  • 每个 Pod 的网络出站流量(字节数)
  • Pod 阶段
  • Kubernetes 容器 - 内存请求利用率
  • Kubernetes 容器 - 内存限额利用率
  • Kubernetes 容器 - CPU 请求利用率
  • Kubernetes 容器 - CPU 限额利用率
  • Kubernetes Pod - 卷利用率
Anthos Clusters on VMware 虚拟机状态 此信息中心包含以下图表,用于指示 VMware 虚拟机的健康状况:
  • 每个 vCPU 的 CPU 就绪状态(百分比)
  • 内存页面故障延迟状况(百分比)
  • 平均虚拟磁盘读取延迟时间(秒)
  • 平均虚拟磁盘写入延迟时间(秒)
Anthos 集群利用率计量 此信息中心包含以下图表,用于指示每个集群的 CPU、内存和临时存储空间的请求和消耗状况:
  • Kubernetes 容器 - 请求核心数量[总和]
  • Kubernetes 容器 - CPU 使用时间[总和]
  • Kubernetes 容器 - 内存请求[总和]
  • Kubernetes 容器 - 内存用量[总和]
  • Kubernetes 容器 - 临时存储空间请求[总和]
  • Kubernetes 容器 - 临时存储空间用量[总和]

如需详细了解预定义信息中心,请参阅信息中心和图表。如需了解如何查看和使用信息中心,请参阅查看 Google Cloud 信息中心

“集成”页面

从 GKE Enterprise 1.15.0 版开始,Cloud Monitoring 集成页面提供新的 GKE Enterprise 集成。如果您已安装 GKE 集群,或者已在 Google Cloud 上设置 GKE Enterprise,则会看到此集成。GKE Enterprise 集成提供了预定义 GKE Enterprise 信息中心的相关信息,包括预览功能:

  • Anthos 集群控制平面正常运行时间
  • Anthos 集群节点状态
  • Anthos 集群 Pod 状态
  • Anthos Clusters on VMware 虚拟机状态
  • Anthos 集群利用率计量

如上一部分所述,如果您拥有 GKE Enterprise 集群,系统便会自动安装这些信息中心。您无法直接修改这些信息中心,因为它们完全由 Google 管理。不过,您可以创建信息中心的副本并自定义该复制的版本,也可以从示例库将这些信息中心添加为自定义信息中心

旧版集群的信息中心

如果您是使用旧版 Google Distributed Cloud 创建的集群,则您的信息中心可能已过时。从 Google Distributed Cloud 1.16.0 版开始,以下自定义信息中心将被弃用:

  • GKE On-Prem 节点状态
  • GKE On-Prem 控制平面正常运行时间
  • GKE On-Prem Pod 状态
  • GKE On-Prem vSphere 虚拟机健康状况
  • 如果您是使用 Google Distributed Cloud 1.15.0 或更低版本创建的集群,则系统已自动安装这些信息中心。

    我们建议您按照删除自定义信息中心中所述移除这些已弃用的信息中心。

    如需详细了解信息中心,包括如何安装和使用信息中心,请参阅 Google Cloud Observability 文档中的信息中心和图表部分。