修复管理员集群的控制平面虚拟机

在 VMware 上的 Anthos 集群 (GKE On-Prem) 实现中,管理员集群的控制层面虚拟机有两个挂接的磁盘:

  • 启动磁盘包含虚拟机的操作系统。

  • 数据磁盘包含凭据和 etcd 数据库,后者存储管理员集群的状态。也就是说,数据磁盘存储管理员集群的所有 Kubernetes 对象。

本页面介绍如何在控制平面虚拟机丢失或启动磁盘损坏后进行恢复。例如:

  • 启动磁盘由于垃圾日志而变为只读。
  • Docker 叠加文件系统损坏。

本页面未介绍如何恢复数据磁盘。如需了解如何恢复数据磁盘,请参阅恢复管理员集群

修复控制平面虚拟机

如需修复管理员集群的控制平面虚拟机,请执行以下操作:

gkectl repair admin-master --config ADMIN_CLUSTER_CONFIG --kubeconfig ADMIN_CLUSTER_KUBECONFIG

替换:

  • ADMIN_CLUSTER_CONFIG,替换为管理员集群配置文件的路径。

  • ADMIN_CLUSTER_KUBECONFIG,替换为管理员集群的 kubeconfig 文件的路径。

备注

管理员集群的控制平面虚拟机会被克隆到一个虚拟机模板中,该模板具有重新创建虚拟机所需的所有信息。gkectl repair admin-master 命令使用该虚拟机模板来创建新的虚拟机。然后,它会挂接新的启动磁盘和现有的数据磁盘。

如果集群节点从 DHCP 服务器获取其地址,则新虚拟机的 IP 地址可能不同于来自原始虚拟机的地址。