Google Kubernetes Engine (GKE) 包含与 Cloud Logging 和 Cloud Monitoring 的集成,包括 Google Cloud Managed Service for Prometheus。
创建在 Google Cloud 上运行的 GKE 集群时,Cloud Logging 和 Cloud Monitoring 会默认启用并提供专为 Kubernetes 定制的可观测性。
您可以控制从 GKE 集群发送到 Cloud Logging 和 Cloud Monitoring 的日志和指标(如果有)。您还可以控制是否启用 Google Cloud Managed Service for Prometheus,它可让您使用 Prometheus 针对工作负载进行监控和提醒,而不必大规模手动管理和操作 Prometheus。如需了解安装和配置说明,请参阅为 GKE 配置 Cloud Operations。
关于 Cloud Operations for GKE
Cloud Operations for GKE 旨在监控 GKE 集群。它可同时管理 Monitoring 和 Logging 服务,并具有 Cloud Operations for GKE 信息中心,可为 GKE 集群提供自定义界面:
您可以查看集群的关键指标,例如 CPU 利用率、内存利用率和尚未解决的突发事件数量。
您可以按基础架构、工作负载或服务来查看集群。
您可以检查命名空间、节点、工作负载、服务、pod 和容器。
对于 Pod 和容器,您可以查看指标(时间函数形式)并查看日志条目。
价格
Cloud Operations for GKE 的价格取决于收集的日志和指标数量。请参阅价格页面了解详情。
Cloud Operations for GKE 方法指南
配置 Cloud Operations for GKE:介绍如何在新集群和现有集群中启用 Cloud Operations for GKE。
观察系统:介绍 Cloud Operations for GKE 信息中心界面、如何组织集群信息以及如何查看提醒详情。
启用
auditd
日志:介绍如何在 GKE 集群节点上启用详细的操作系统级审核日志记录以及如何将日志导出到 Cloud Logging。