识别空闲 GKE 集群


您可以使用空闲集群 Recommender 的数据分析和建议来识别空闲的 Google Kubernetes Engine (GKE) 标准集群。确认未使用的空闲集群未使用后,您可以将其删除以节省费用。空闲集群 Recommender 与 Autopilot 集群无关,这些集群会产生少许操作费用,因为您只需为工作负载请求的资源付费。如需了解详情,请参阅 Autopilot 价格

GKE 会监控您的集群并通过 Recommender 提供指导以优化您的使用。Recommender 是一项提供有关 Google Cloud 上的资源使用的分析洞见和建议的服务。

如需详细了解如何管理分析洞见和建议,请参阅利用分析洞见和建议优化 GKE 使用

识别空闲集群

如需识别空闲集群,请使用 Google Cloud 控制台、Google Cloud CLI 或 Recommender API 查看由空闲集群 Recommender 生成的数据分析和建议。使用下一部分中的表显示的数据分析子类型,及建议的子类型 CLUSTER_IDLE。在控制台中,这些数据分析显示在集群页面上的费用优化标签页中。

确定空闲集群后,请参阅删除空闲集群时的注意事项

Recommender 如何识别空闲集群

此 Recommender 使用利用率信号来确定您是否应该收到分析洞见或建议。

下表介绍了空闲集群 Recommender 使用的信号以及每个信号的阈值。每个信号都会触发独立的分析洞见。 如果同一集群有多个数据分析,GKE 会显示单个建议。

提示子类型 信号 阈值 详细信息
CLUSTER_IDLE_NO_RUNNING_PODS 没有正在运行的客户 Pod 过去 30 天 过去 30 天内,在集群指标事件日志中,kube-systemgmp-system 命名空间之外没有 Running 状态的 Pod。
CLUSTER_IDLE_NO_NODES 没有节点或节点池 过去 30 天 过去 30 天内,集群的指标事件日志中没有任何节点或节点池。
CLUSTER_IDLE_LOW_CPU_UTILIZATION CPU 利用率低且没有新对象 过去 30 天内的 1 小时平均值低于 7% 过去 30 天内,CPU 利用率(1 小时平均值)低于 7%,并且对象数量没有变化。

删除空闲集群时的注意事项

在删除空闲集群 Recommender 建议的空闲集群之前,请考虑以下可能性:

  • 有人使用集群吗?例如,如果集群的用途是维持故障切换容量,您可能有意地空闲。
  • 是否应该缩容而不是删除集群?例如,运行有用工作负载的集群利用率可能较低,并标识为空闲资源,因为预配的资源超出需求。

实现删除空闲集群的建议

如果您收到的见解和建议表明您有一个可以删除的空闲集群,并且已经排除了保持集群运行的注意事项,请按照建议中的说明删除集群。

后续步骤