本页面介绍如何通过确定具有利用率过低的节点(可以通过迁移到 GKE Autopilot 来解决此问题)的 Google Kubernetes Engine (GKE) Standard 集群,来降低集群运维费用。
可通过迁移到 Autopilot 来节省费用
在 GKE Standard 集群中,无论正在运行的工作负载使用计算资源的效率如何,您都需要为支持每个节点的 Compute Engine 虚拟机 (VM) 基础架构付费。若要以经济实惠的方式运行 Standard 集群,您必须使用高效的资源消耗方法(如装箱)来持续地管理资源用量。
在 Autopilot 中,系统是按正在运行的工作负载请求的计算资源(例如 CPU 或内存)向您收取费用。此结算模式让您无需监控和管理工作负载资源的使用效率。如需详细了解价格信息,请参阅 Autopilot 模式价格。
GKE 会监控正在运行的 Standard 集群,以检测节点利用率低下的情况;并且如果迁移到 Autopilot 集群可能会降低您的运维费用,则会建议您进行迁移。GKE 通过 Recommender 提供这些建议,该服务会提供有关在 Google Cloud 上使用资源的数据分析和建议。
确定利用率低下的 Standard 集群
GKE 会生成数据分析和建议,以帮助您确定利用率低下的 Standard 集群。如需查看这些数据分析,请使用 Google Cloud 控制台、gcloud CLI 或 Recommender API 并指定以下参数:
- Recommender 类型:
google.container.DiagnosisInsight
- 子类型:
CLUSTER_AUTOPILOT_OPTIMIZATION
如需查看相关说明,请参阅查看数据分析和建议。
GKE 如何确定可通过迁移到 Autopilot 获益的集群
GKE 使用以下信号来确定 Standard 模式的集群是否利用率低下。集群必须满足以下信号条件,GKE 才能生成数据分析:
信号 | 说明 | 阈值 |
---|---|---|
CPU 装箱得分 | 正在运行的工作负载请求的节点 CPU 量,以节点上的总可用 CPU 的百分比来表示。 | <55% |
决定是否迁移到 Autopilot
Autopilot 集群会将节点管理职责转移给 GKE。在将工作负载迁移到 Autopilot 集群之前,请查看以下资源以确定 Autopilot 是否满足您的可配置性和功能需求:
在大多数生产环境中,我们建议使用 Autopilot 集群。
限制
如果 GKE Standard 集群的近期指标不可用,则您可能看不到该集群的数据分析。
如何处理建议
如果您看到此建议,请与 Cloud Customer Care 联系,以详细了解迁移到 Autopilot 集群对您的环境有何帮助。请与您的客户代表联系,或查看与 Cloud Customer Care 联系一文。
如果您决定从 Standard 迁移,请检查工作负载与 Autopilot 是否兼容,并按照准备从 Standard 迁移到 Autopilot 中的说明准备迁移。