识别空闲 GKE 集群


您可以使用分析洞见和建议来识别空闲的 Google Kubernetes Engine (GKE) 标准集群。确认未使用的空闲集群未使用后,您可以将其删除以节省费用。如果可能,建议会包含删除集群后预计每月节省的费用。如需了解详情,请参阅了解空闲集群的费用估算

GKE 针对费用优化场景(例如预配不足的集群、超额预配的集群和空闲集群)提供分析洞见和建议,并提供相应的建议来对集群进行扩容、缩容或将其删除。本页面介绍如何识别空闲集群。另请参阅识别预配不足和超额预配的 GKE 集群

GKE 不会为 Autopilot 集群提供分析洞见,这些集群仅产生极少的操作费用,因为您只需为工作负载请求的资源付费。如需了解详情,请参阅 Autopilot 价格

GKE 会监控您的集群,并通过 Active Assist 提供指导以优化您的使用。Active Assist 是一项提供 Recommender 的服务,Recommender 会生成有关使用 Google Cloud上的资源的分析洞见和建议。

如需详细了解如何管理分析洞见和建议,请参阅利用分析洞见和建议优化 GKE 使用

识别空闲集群

如需识别空闲集群,请使用 Google Cloud 控制台、Google Cloud CLI 或 Recommender API 查看分析洞见和建议。使用下一部分中的表显示的分析洞见子类型,以及建议子类型 CLUSTER_IDLE。在控制台中,这些分析洞见显示在集群页面上的费用优化标签页中。

确定空闲集群后,请参阅删除空闲集群时的注意事项

GKE 如何识别空闲集群

GKE 会使用利用率信号来确定您是否会收到分析洞见和建议。

下表介绍了 GKE 使用的信号以及每个信号的阈值。每个信号都会触发独立的分析洞见。如果一个集群有多个分析洞见,GKE 会显示一条建议。

提示子类型 信号 观察期 详细信息
CLUSTER_IDLE_NO_RUNNING_PODS 没有正在运行的客户 Pod 过去 30 天 过去 30 天内,在集群指标事件日志中,kube-systemgmp-system 命名空间之外没有 Running 状态的 Pod。
CLUSTER_IDLE_NO_NODES 没有节点或节点池 过去 30 天 过去 30 天内,集群的指标事件日志中没有任何节点或节点池。
CLUSTER_IDLE_LOW_CPU_UTILIZATION CPU 利用率低且没有新 Pod 过去 30 天 如果满足以下两个条件,则表示 GKE 集群处于空闲状态,且 CPU 利用率较低:
  • 在过去 30 天内,每小时的平均 CPU 利用率始终低于 7%。
  • 在过去 30 天内,活跃 Pod 数量保持不变。

GKE 不会针对创建时间不到 30 天的集群发送建议。

了解空闲集群的费用估算

如果可能,GKE 会在建议中包含空闲集群的每月预计费用,预测在删除集群的情况下每月可节省多少费用。此预计费用是根据过去 30 天的集群费用估算的。

任何预计可节省的金额都是基于先前支出的预测值,并不能保证未来的费用或节省的金额。

如需查看这些估算值,请确保您拥有所需的 billing.accounts.getSpendingInformation 权限来获取支出信息。如需了解详情,请参阅 Cloud Billing 访问权限

如需详细了解所有 GKE 集群的费用,包括基于命名空间和工作负载的更精细的费用明细,请参阅获取 GKE 资源分配和集群费用的关键支出分析

如需详细了解运行 GKE 集群的费用,请参阅 GKE 价格

删除空闲集群时的注意事项

在删除 GKE 确定为空闲的集群之前,请考虑以下可能性:

  • 有人使用集群吗?例如,如果集群的用途是维持故障切换容量,您可能有意地空闲。
  • 是否应该缩容而不是删除集群?例如,运行有用工作负载的集群利用率可能较低,并标识为空闲资源,因为预配的资源超出需求。

实现删除空闲集群的建议

如果您收到的见解和建议表明您有一个可以删除的空闲集群,并且已经排除了保持集群运行的注意事项,请按照建议中的说明删除集群。

后续步骤