在 VMware 上的 Anthos 集群 (GKE On-Prem) 实现中,管理员集群的控制层面虚拟机有两个挂接的磁盘:
启动磁盘包含虚拟机的操作系统。
数据磁盘包含凭据和 etcd 数据库,后者存储管理员集群的状态。也就是说,数据磁盘存储管理员集群的所有 Kubernetes 对象。
本页面介绍如何在控制平面虚拟机丢失或启动磁盘损坏后进行恢复。例如:
- 启动磁盘由于垃圾日志而变为只读。
- Docker 叠加文件系统损坏。
本页面未介绍如何恢复数据磁盘。如需了解如何恢复数据磁盘,请参阅恢复管理员集群。
修复控制平面虚拟机
如需修复管理员集群的控制平面虚拟机,请执行以下操作:
gkectl repair admin-master --config ADMIN_CLUSTER_CONFIG --kubeconfig ADMIN_CLUSTER_KUBECONFIG
替换:
ADMIN_CLUSTER_CONFIG,替换为管理员集群配置文件的路径。
ADMIN_CLUSTER_KUBECONFIG,替换为管理员集群的 kubeconfig 文件的路径。
备注
管理员集群的控制平面虚拟机会被克隆到一个虚拟机模板中,该模板具有重新创建虚拟机所需的所有信息。gkectl repair admin-master
命令使用该虚拟机模板来创建新的虚拟机。然后,它会挂接新的启动磁盘和现有的数据磁盘。
如果集群节点从 DHCP 服务器获取其地址,则新虚拟机的 IP 地址可能不同于来自原始虚拟机的地址。