适用于 GKE 的 Google Cloud 的运维套件概览

Google Kubernetes Engine (GKE) 中包括了与 Cloud Monitoring 和 Cloud Logging 的原生集成。创建 GKE 集群时,Cloud Operations for GKE 默认处于启用状态,并提供专为 Kubernetes 定制的监控信息中心。

借助 Cloud Operations for GKE,您可以控制 Cloud Logging 是否收集应用日志。您也可以选择完全停用 Cloud Monitoring 和 Cloud Logging 集成。如需详细了解安装说明,请参阅安装 Cloud Operations for GKE 支持

关于 Cloud Operations for GKE

Cloud Operations for GKE 旨在监控 GKE 集群。它可同时管理 Monitoring 和 Logging 服务,并具有 Cloud Operations for GKE 信息中心,可为 GKE 集群提供自定义界面:

  • 在“摘要”窗格中,您可以查看集群的关键指标,例如 CPU 利用率、内存利用率和未结突发事件数量。

  • 您可以按基础架构、工作负载或服务来查看集群。

  • 您可以检查命名空间、节点、工作负载、服务、pod 和容器。

  • 对于 pod 和容器,您可以查看指标(时间函数形式)并使用日志查看器查看日志条目。

我应该使用哪个监控和日志记录选项?

您可以使用 Cloud Operations for GKE 默认信息中心,也可以选择使用旧版 Logging 和 Monitoring。从 GKE 1.12.7 版开始,这两个选项都是正式提供的选项。此时,您还需要注意以下这些问题:

  • 从 GKE 1.14 版开始,Cloud Operations for GKE 为默认选项。

  • 旧版 Logging 和 Monitoring 也是一个正式提供的选项;但是,它缺少 Cloud Operations for GKE 中现有的功能和改进。

  • 只有旧版 Logging 和 Monitoring 允许您在使用 Cloud Monitoring 的同时停用 Cloud Logging。

选择针对 GKE 的 Google Cloud 运营套件支持

如果您使用的是旧版 Logging 和 Monitoring,则必须先切换到 Cloud Operations for GKE,然后才能移除旧版 Logging 和 Monitoring。从 GKE 1.15 开始,我们将不再支持旧版 Logging 和 Monitoring。下表详细介绍了各个 GKE 版本的兼容情况:

GKE 版本 旧版 Logging 和 Monitoring Cloud Operations for GKE
1.10 – 1.12.5 默认 选择启用(测试版)
1.12.7 默认 可选
1.13 默认 可选
1.14 可选 默认
1.15 不可用 默认

如需了解如何弃用旧版 Logging 和 Monitoring,请参阅旧版 GKE 弃用支持指南。

价格

Cloud Storage for GKE 的价格取决于收集的日志和指标数量。如需了解详情,请参阅价格页面。

Cloud Operations for GKE 方法指南

  • 安装 Cloud Operations for GKE:介绍如何在新集群和现有集群中启用 Cloud Operations for GKE。

  • 迁移到 Cloud Operations for GKE:介绍旧版 Logging 和 Monitoring 与 Cloud Operations for GKE 之间的区别,以及您在更新监控和日志记录集成时,必须更改什么 Google Cloud 的运维套件配置。

  • 观察系统:介绍 Cloud Operations for GKE 信息中心界面、如何组织集群信息以及如何查看提醒详情。

  • 启用 auditd 日志:介绍如何在 GKE 集群节点上启用详细的操作系统级审核日志记录以及如何将日志导出到 Cloud Logging。

  • 使用 Prometheus:可选。介绍如何为 Prometheus 配置 Cloud Operations for GKE。

旧版 Logging 和 Monitoring 方法指南