您可以使用分析洞见和建议来识别空闲的 Google Kubernetes Engine (GKE) 标准集群。确认未使用的空闲集群未使用后,您可以将其删除以节省费用。如果可能,建议会包含删除集群后预计每月节省的费用。如需了解详情,请参阅了解空闲集群的费用估算。
GKE 针对费用优化场景(例如预配不足的集群、超额预配的集群和空闲集群)提供分析洞见和建议,并提供相应的建议来对集群进行扩容、缩容或将其删除。本页面介绍如何识别空闲集群。另请参阅识别预配不足和超额预配的 GKE 集群。
GKE 不会为 Autopilot 集群提供分析洞见,这些集群仅产生极少的操作费用,因为您只需为工作负载请求的资源付费。如需了解详情,请参阅 Autopilot 价格。
GKE 会监控您的集群,并通过 Active Assist 提供指导以优化您的使用。Active Assist 是一项提供 Recommender 的服务,Recommender 会生成有关使用 Google Cloud上的资源的分析洞见和建议。
如需详细了解如何管理分析洞见和建议,请参阅利用分析洞见和建议优化 GKE 使用。
识别空闲集群
如需识别空闲集群,请使用 Google Cloud 控制台、Google Cloud CLI 或 Recommender API 查看分析洞见和建议。使用下一部分中的表显示的分析洞见子类型,以及建议子类型 CLUSTER_IDLE
。在控制台中,这些分析洞见显示在集群页面上的费用优化标签页中。
确定空闲集群后,请参阅删除空闲集群时的注意事项。
GKE 如何识别空闲集群
GKE 会使用利用率信号来确定您是否会收到分析洞见和建议。
下表介绍了 GKE 使用的信号以及每个信号的阈值。每个信号都会触发独立的分析洞见。如果一个集群有多个分析洞见,GKE 会显示一条建议。
提示子类型 | 信号 | 观察期 | 详细信息 |
---|---|---|---|
CLUSTER_IDLE_NO_RUNNING_PODS |
没有正在运行的客户 Pod | 过去 30 天 |
过去 30 天内,在集群指标事件日志中,kube-system 和 gmp-system 命名空间之外没有 Running 状态的 Pod。
|
CLUSTER_IDLE_NO_NODES |
没有节点或节点池 | 过去 30 天 | 过去 30 天内,集群的指标事件日志中没有任何节点或节点池。 |
CLUSTER_IDLE_LOW_CPU_UTILIZATION |
CPU 利用率低且没有新 Pod | 过去 30 天 |
如果满足以下两个条件,则表示 GKE 集群处于空闲状态,且 CPU 利用率较低:
|
GKE 不会针对创建时间不到 30 天的集群发送建议。
了解空闲集群的费用估算
如果可能,GKE 会在建议中包含空闲集群的每月预计费用,预测在删除集群的情况下每月可节省多少费用。此预计费用是根据过去 30 天的集群费用估算的。
任何预计可节省的金额都是基于先前支出的预测值,并不能保证未来的费用或节省的金额。
如需查看这些估算值,请确保您拥有所需的 billing.accounts.getSpendingInformation
权限来获取支出信息。如需了解详情,请参阅 Cloud Billing 访问权限。
如需详细了解所有 GKE 集群的费用,包括基于命名空间和工作负载的更精细的费用明细,请参阅获取 GKE 资源分配和集群费用的关键支出分析。
如需详细了解运行 GKE 集群的费用,请参阅 GKE 价格。
删除空闲集群时的注意事项
在删除 GKE 确定为空闲的集群之前,请考虑以下可能性:
- 有人使用集群吗?例如,如果集群的用途是维持故障切换容量,您可能有意地空闲。
- 是否应该缩容而不是删除集群?例如,运行有用工作负载的集群利用率可能较低,并标识为空闲资源,因为预配的资源超出需求。
实现删除空闲集群的建议
如果您收到的见解和建议表明您有一个可以删除的空闲集群,并且已经排除了保持集群运行的注意事项,请按照建议中的说明删除集群。