使用预定义的信息中心

本文档介绍了适用于 Bare Metal 的 GDCV 的预定义监控信息中心。您还可以找到相关信息和资源的链接,可帮助您使用信息中心。

Cloud Monitoring 提供了一组精选的信息中心,专门用于各种 Google Cloud 服务。这些信息中心上的图表提供一系列与特定服务相关的指标。检测到给定服务(如 GKE Enterprise)时,系统会自动安装这些信息中心。

预定义信息中心

当 Cloud Monitoring 检测到 GKE Enterprise 指标 kubernetes.io/anthos/container/uptime 可用时,它会在您的项目中提供预定义的 GKE Enterprise 信息中心。创建 GKE 集群时,此指标默认可用,因此信息中心会自动安装。系统会添加以下预定义信息中心:

信息中心名称 说明
Anthos 集群控制平面正常运行时间 此信息中心包含以下图表,用于指示控制平面组件的正常运行时间:
  • API 服务器正常运行时间
  • 调度器正常运行时间
  • 控制器管理器正常运行时间
  • ETCD 正常运行时间
Anthos 集群节点状态 此信息中心包含以下图表,用于指示集群节点的状态:
  • 节点条件
  • CPU 使用率
  • 可分配的 CPU 核心数量
  • 可分配 CPU 利用率
  • 内存用量
  • 可分配的内存
  • 可分配内存利用率
  • 可用的文件系统大小
Anthos 集群 Pod 状态 此信息中心包含以下图表,用于指示集群中运行的 pod 的状态:
  • 每个容器的重启次数
  • 每个容器的容器内存用量
  • 每个容器的容器 CPU 使用率
  • 每个 Pod 的网络入站流量(字节数)
  • 每个 Pod 的网络出站流量(字节数)
  • Pod 阶段
  • Kubernetes 容器 - 内存请求利用率
  • Kubernetes 容器 - 内存限额利用率
  • Kubernetes 容器 - CPU 请求利用率
  • Kubernetes 容器 - CPU 限额利用率
  • Kubernetes Pod - 卷利用率
Anthos 集群 KubeVirt 虚拟机状态 此信息中心包含以下图表,用于指示在 Anthos 集群中运行的虚拟机的状态:
  • 每个虚拟机的 CPU 用量
  • 每个虚拟机的内存用量
  • 每个虚拟机的未使用内存
  • 每个虚拟机每个接口的网络 RX 字节数/秒
  • 每个虚拟机每个接口的网络 TX 字节数/秒
  • 每个虚拟机每个接口的网络 RX 错误数/秒
  • 每个虚拟机每个接口的网络 TX 错误数/秒
  • 每个虚拟机每个接口的网络 RX 数据包数/秒
  • 每个虚拟机每个接口的网络 TX 数据包数/秒
  • 每个虚拟机每个接口的网络 RX 丢包数/秒
  • 每个虚拟机每个接口的网络 TX 丢包数/秒
  • 每个虚拟机每个磁盘的存储读取 IOPS
  • 每个虚拟机每个磁盘的存储写入 IOPS
Anthos 集群利用率计量 此信息中心包含以下图表,用于指示每个集群的 CPU、内存和临时存储空间的请求和消耗状况:
  • Kubernetes 容器 - 请求核心数量[总和]
  • Kubernetes 容器 - CPU 使用时间[总和]
  • Kubernetes 容器 - 内存请求[总和]
  • Kubernetes 容器 - 内存用量[总和]
  • Kubernetes 容器 - 临时存储空间请求[总和]
  • Kubernetes 容器 - 临时存储空间用量[总和]

如需详细了解预定义信息中心,请参阅信息中心和图表。如需了解如何查看和使用信息中心,请参阅查看 Google Cloud 信息中心

“集成”页面

从 GKE Enterprise 1.15.0 版开始,Cloud Monitoring 集成页面提供了新的 GKE Enterprise 集成。如果您已安装 GKE 集群或已设置 Google Cloud 上的 GKE Enterprise,则会看到此集成。GKE Enterprise 集成包含预定义 GKE Enterprise 信息中心的信息(包括预览):

  • Anthos 集群控制平面正常运行时间
  • Anthos 集群节点状态
  • Anthos 集群 Pod 状态
  • Anthos 集群 KubeVirt 虚拟机状态
  • Anthos 集群利用率计量

如上一部分所述,当您拥有 GKE Enterprise 集群时,系统会自动安装这些信息中心。您无法直接修改这些信息中心,因为它们完全由 Google 管理。不过,您可以创建信息中心的副本并自定义该复制的版本,也可以从示例库将这些信息中心添加为自定义信息中心

旧版集群的信息中心

如果您使用适用于 Bare Metal 的早期 GDCV 版本创建集群,则您的信息中心可能已过期。从适用于 Bare Metal 版本 1.16.0 的 GDCV 开始,以下自定义信息中心将被弃用:

  • Anthos 集群控制平面正常运行时间
  • Anthos 集群节点状态
  • Anthos 集群 Pod 状态
  • Anthos 利用率计量

如果您使用适用于 Bare Metal 版本 1.15.0 或更低版本的 GDCV 创建集群,则这些信息中心会自动安装。

我们建议您按照删除自定义信息中心中所述移除这些已弃用的信息中心。

如需详细了解信息中心(包括如何安装和使用它们),请参阅 Google Cloud Observability 文档中的信息中心和图表