恢复 GKE on Bare Metal 中的失败升级

有时,GKE on Bare Metal 可能会遇到以下情况,需要重新开始升级,或解决错误状况以成功完成升级。升级集群时可能会出现以下情况。尝试按照情况中所述完成集群升级。

恢复管理员、混合和独立集群升级

管理员、混合和独立集群都使用 bmctl upgrade 命令升级。

如果升级未能成功完成,请检查以下情况,然后重新尝试升级。

  • 由于出现错误,bmctl 未能解析配置文件。修复配置文件并重新运行命令。
  • bmctl 未能引导临时集群。重试此命令。
  • 日志文件表明升级未能通过预检检查。修正预检条件或强制升级。
  • 升级耗时过长(超过 30 分钟)或超时。重试升级命令。

恢复用户集群升级

使用 kubectl apply 命令从关联的管理员集群升级用户集群。

如果升级未能成功完成,请检查以下情况,然后重新尝试升级。

  • 预检检查失败。检查预检检查日志并修复相应的错误。
  • 您可能需要按照这些说明构建新的预检自定义资源,并将其应用到集群。检查触发的预检是否通过,以及集群协调器是否提取了最新的通过状态。