适用于 GKE 的 Google Cloud 的运维套件概览

Google Kubernetes Engine (GKE) 中包括了与 Cloud Monitoring 和 Cloud Logging 的原生集成。创建 GKE 集群时,Kubernetes Engine Operations 会默认启用并提供专为 Kubernetes 定制的监控信息中心。

借助 Kubernetes Engine Operations,您可以控制 Cloud Logging 是否收集应用日志。您也可以选择完全停用 Cloud Monitoring 和 Cloud Logging 集成。如需详细了解安装说明,请参阅为 GKE 安装 Monitoring 和 Logging 支持

关于 Kubernetes Engine Operations

Kubernetes Engine Operations 用于监控 GKE 集群。它同时管理 Monitoring 和 Logging 服务,并提供 Kubernetes Engine Operations 信息中心,可为 GKE 集群提供自定义界面:

  • 在“摘要”窗格中,您可以查看集群的关键指标,例如 CPU 利用率、内存利用率和未结突发事件数量。

  • 您可以按基础架构、工作负载或服务来查看集群。

  • 您可以检查命名空间、节点、工作负载、服务、pod 和容器。

  • 对于 pod 和容器,您可以查看指标(时间函数形式)并使用日志查看器查看日志条目。

我应该使用哪个监控和日志记录选项?

您可以使用默认的 Kubernetes Engine Operations 信息中心,也可以选择使用旧版 Logging 和 Monitoring。从 GKE 1.12.7 版开始,这两个选项都是正式提供的选项。此时,您还需要注意以下这些问题:

  • 从 GKE 版本 1.14 开始,Kubernetes Engine Operations 是默认选项。

  • 旧版 Logging 和 Monitoring 也是一个正式提供的选项;但是,它缺少 Kubernetes Engine Operations 中提供的功能和改进。

  • 只有旧版 Logging 和 Monitoring 允许您在使用 Cloud Monitoring 的同时停用 Cloud Logging。

选择针对 GKE 的 Google Cloud 运维套件支持

如果您使用的是旧版 Logging 和 Monitoring,则在系统停止支持旧版 Logging 和 Monitoring 之前,您必须切换到 Kubernetes Engine Operations。从 GKE 1.15 开始,我们将不再支持旧版 Logging 和 Monitoring。下表详细介绍了各个 GKE 版本的兼容情况:

GKE 版本 旧版 Logging 和 Monitoring Kubernetes Engine Operations
1.10 – 1.12.5 默认 选择启用(测试版)
1.12.7 默认 可选
1.13 默认 可选
1.14 可选 默认
1.15 不可用 默认

价格

Kubernetes Engine Operations 根据收集的日志和指标量计费。如需了解详情,请参阅价格页面。

Kubernetes Engine Operations 方法指南

  • 安装 Kubernetes Engine Operations:介绍如何在新集群和现有集群中启用 Kubernetes Engine Operations。

  • 迁移到 Kubernetes Engine Operations:介绍旧版 Logging 和 Monitoring 和 Kubernetes Engine Operations 之间的区别,以及您在更新监控和日志记录集成时必须更改的 Google Cloud 的运维套件配置。

  • 观察系统:介绍 Kubernetes Engine Operations 的信息中心界面、如何组织集群信息以及如何查看提醒详情。

  • 启用 auditd 日志:介绍如何在 GKE 集群节点上启用详细的操作系统级审核日志记录以及如何将日志导出到 Cloud Logging。

  • 使用 Prometheus:可选。介绍如何配置 Kubernetes Engine Operations 以支持 Prometus

旧版 Logging 和 Monitoring 方法指南