删除用户集群

本页面介绍如何删除 GKE On-Prem 用户集群。

概览

GKE On-Prem 支持通过 gkectl 删除运行状况良好的用户集群。如果集群运行状况不佳(例如,如果控制平面无法访问或集群无法引导),请改为参考手动删除用户集群

删除用户集群

运行以下命令:

gkectl delete cluster \
--kubeconfig [ADMIN_CLUSTER_KUBECONFIG] \
--cluster [CLUSTER_NAME]

其中,[ADMIN_CLUSTER_KUBECONFIG] 是管理员集群的 kubeconfig 文件,[CLUSTER_NAME] 是您要删除的用户集群的名称。

完成操作后

在 gkectl 完成删除用户集群后,删除用户集群 kubeconfig。

已知问题

删除集群后,系统可能会在 vSphere 中再创建一个用户控制平面虚拟机。通过执行以下步骤,验证是否已删除所有用户集群虚拟机:

  1. 从 vSphere Web 客户端左侧的 Navigator 菜单中,点击 Hosts and Clusters 菜单。
  2. 找到您的资源池。
  3. 不应存在以您的用户集群名称为前缀的虚拟机。

如果还存在用户集群虚拟机,请从 vSphere 网页客户端执行以下步骤:

  1. 右键点击用户集群虚拟机,然后选择 Power > Power Off
  2. 关闭虚拟机后,右键点击虚拟机,然后选择 Delete from Disk

问题排查

如需了解详情,请参阅问题排查

使用 gkectl 诊断集群问题

使用 gkectl diagnose 命令识别集群问题并与 Google 共享集群信息。请参阅诊断集群问题

默认日志记录行为

对于 gkectlgkeadm,使用默认日志记录设置便已足够:

  • 默认情况下,日志条目的保存方式如下:

    • 对于 gkectl,默认日志文件为 /home/ubuntu/.config/gke-on-prem/logs/gkectl-$(date).log,该文件与运行 gkectl 的本地目录中的 logs/gkectl-$(date).log 文件进行符号链接。
    • 对于 gkeadm,默认日志文件是运行 gkeadm 的本地目录中的 logs/gkeadm-$(date).log
  • 所有日志条目都会保存在日志文件中,即使它们不输出到终端(当 --alsologtostderrfalse 时)也是如此。
  • -v5 详细程度(默认)涵盖支持团队所需的所有日志条目。
  • 日志文件还包含已执行的命令和失败消息。

我们建议您在需要帮助时将日志文件发送给支持团队。

为日志文件指定非默认位置

要为 gkectl 日志文件指定非默认位置,请使用 --log_file 标志。您指定的日志文件不会与本地目录进行符号链接。

要为 gkeadm 日志文件指定非默认位置,请使用 --log_file 标志。

在管理员集群中查找 Cluster API 日志

如果虚拟机在管理员控制层面启动后无法启动,您可以通过在管理员集群中检查 Cluster API 控制器的日志来尝试进行调试:

  1. kube-system 命名空间中找到 Cluster API 控制器 pod 的名称,其中 [ADMIN_CLUSTER_KUBECONFIG] 是管理员集群的 kubeconfig 文件的路径:

    kubectl --kubeconfig [ADMIN_CLUSTER_KUBECONFIG] -n kube-system get pods | grep clusterapi-controllers
  2. 打开 pod 的日志,其中 [POD_NAME] 是 pod 的名称。您可以选择使用 grep 或类似工具来搜索错误:

    kubectl --kubeconfig [ADMIN_CLUSTER_KUBECONFIG] -n kube-system logs [POD_NAME] vsphere-controller-manager