在集群安装过程中,二进制文件和 systemd 服务会安装在托管集群的节点上,并且服务开始监听节点上的端口。
但是,如果集群安装失败,则需要删除所有这些二进制文件和服务。换句话说,在尝试重新安装集群之前,需要重置或擦除这些节点。如果未以这种方式重置节点,则在这些节点上安装集群的下一次尝试将失败。
bmctl reset
命令执行节点的清理操作。您可以在整个集群或集群的特定节点上运行 bmctl reset
命令,本文档介绍如何在这两种模式下运行该命令。
请务必注意,将 bmctl reset
命令应用于集群时,该集群将被删除,因为该命令会清除节点上的所有集群二进制文件和服务。
使用 bmctl reset cluster
重置集群
重置集群会导致集群被删除。集群被删除后,您可以在进行任何所需的配置更改后重新安装它。
重置自行管理的集群
如需重置管理员集群、混合集群或独立集群,请运行以下命令:
bmctl reset --cluster CLUSTER_NAME
在该命令中,将 CLUSTER_NAME
替换为您要重置的集群的名称。
集群重置完成后,您可以创建新集群。如需了解详情,请参阅集群创建概览。
重置用户集群
您可以使用 bmctl reset
命令或 kubectl delete
命令重置或删除用户集群。在这两种情况下,集群都会被删除。我们建议您使用 bmctl reset
。
使用 bmctl
重置/删除用户集群
运行以下命令以使用 bmctl
重置/删除用户集群:
bmctl reset --cluster CLUSTER_NAME --admin-kubeconfig ADMIN_KUBECONFIG_PATH
在该命令中,将以下条目替换为特定于您的环境的信息:
CLUSTER_NAME
:要重置的用户集群的名称。ADMIN_KUBECONFIG_PATH
:关联管理员集群的kubeconfig
文件的路径。bmctl
支持使用--kubeconfig
作为--admin-kubeconfig
标志的别名。
使用 kubectl
删除用户集群
如需使用 kubectl
删除用户集群,您必须先删除集群对象,然后删除其命名空间。否则无法创建重置机器的作业,删除过程可能会无限期卡住。
要使用 kubectl
删除用户集群,请执行以下操作:
运行以下命令以删除集群对象:
kubectl delete cluster CLUSTER_NAME -n CLUSTER_NAMESPACE \ --kubeconfig ADMIN_KUBECONFIG_PATH
在该命令中,将以下条目替换为特定于您的环境的信息:
CLUSTER_NAME
:要删除的用户集群的名称。CLUSTER_NAMESPACE
:集群的命名空间。默认情况下,Anthos clusters on Bare Metal 的集群命名空间是以cluster-
开头的集群名称。例如,如果您将集群命名为test
,则命名空间的名称类似于cluster-test
。ADMIN_KUBECONFIG_PATH
:关联管理员集群的kubeconfig
文件的路径。
成功删除集群后,运行以下命令以删除命名空间:
kubectl delete namespace CLUSTER_NAMESPACE --kubeconfig ADMIN_KUBECONFIG_PATH
重置特定集群节点
在某些情况下您可能需要重置集群的特定节点,例如管理员集群已被删除,但由该管理员集群管理的用户集群仍然存在。在这种情况下,由于管理员集群已被删除,将无法删除所有用户集群。因此,用户集群的节点必须单独重置。
使用 GCR 服务帐号的 JSON 密钥重置节点
如需重置集群的各个节点,请运行以下命令:
bmctl reset nodes --addresses NODE_1_IP_ADDRESS,NODE_2_IP_ADDRESS \
--ssh-key-private-path SSH_KEY_PATH \
--gcr-service-account-key SERVICE_ACCOUNT_KEY_PATH \
--login-user root
在该命令中,将以下条目替换为特定于您的环境的信息:
NODE_1_IP_ADDRESS , NODE_2_IP_ADDRESS
:要删除的节点的 IP 地址的逗号分隔列表。SSH_KEY_PATH
:SSH 私钥的路径。SERVICE_ACCOUNT_KEY_PATH
:包含服务帐号密钥的 JSON 文件的路径。此密钥授权bmctl
从 Google Container Registry (GCR) 拉取映像。您可以使用 Google Cloud Console、gcloud CLI、serviceAccounts.keys.create()
方法或某种客户端库创建服务帐号密钥。如需了解详情,请参阅创建和管理服务帐号密钥。创建服务帐号密钥文件的另一种方法是,运行带有--create-service-accounts
标志的create config
命令。如需详细了解该命令,请参阅使用 bmctl 创建管理员集群配置。
重置集群详情
bmctl cluster reset
命令的输出类似于以下示例:
bmctl reset --cluster cluster1
Creating bootstrap cluster... OK
Deleting GKE Hub member admin in project my-gcp-project...
Successfully deleted GKE Hub member admin in project my-gcp-project
Loading images... OK
Starting reset jobs...
Resetting: 1 Completed: 0 Failed: 0
...
Resetting: 0 Completed: 1 Failed: 0
Flushing logs... OK
在重置操作期间,bmctl
首先尝试删除 GKE Hub 成员资格注册,然后清理受影响的节点。 重置期间,anthos-system StorageClass
中的存储装载和数据也会被删除。
对于所有节点,bmctl
运行 kubeadm reset
,移除用于集群网络的隧道接口,并删除以下目录:
/etc/kubernetes
/etc/cni/net.d
/root/.kube
/var/lib/kubelet
对于负载均衡器节点,bmctl
还会执行以下操作:
- 停用
keepalived
和haproxy
服务。 - 删除
keepalived
和haproxy
的配置文件。
bmctl reset
命令预期集群配置文件位于当前工作目录中。默认情况下,路径如下所示:bmctl-workspace/CLUSTER_NAME/CLUSTER_NAME.yaml
如果您在集群创建期间使用 --workspace-dir
标志指定了其他目录,则必须在集群重置期间使用此标志指定工作目录。