Google Distributed Cloud 구현에서 관리자 클러스터의 제어 영역 VM에는 두 개의 연결된 디스크가 있습니다.
부팅 디스크에는 VM용 운영체제가 있습니다.
데이터 디스크에는 관리자 클러스터의 상태를 저장하는 사용자 인증 정보와 etcd 데이터베이스가 있습니다. 즉, 데이터 디스크는 관리자 클러스터의 모든 Kubernetes 객체를 저장합니다.
이 페이지에서는 제어 영역 VM이 손실되거나 부팅 디스크가 손상된 경우 복구하는 방법을 보여줍니다. 예를 들면 다음과 같습니다.
- 스팸 저널 로그로 인해 부팅 디스크가 읽기 전용이 됩니다.
- Docker 오버레이 파일 시스템이 손상됩니다.
이 페이지에서는 데이터 디스크 복구에 대해서는 다루지 않습니다. 데이터 디스크를 복구하는 방법은 관리자 클러스터 복원을 참조하세요.
제어 영역 VM 복구
관리자 클러스터의 제어 영역 VM을 복구하기 위한 단계는 보유하고 있는 관리자 클러스터가 고가용성(HA) 관리자 클러스터인지 아닌지에 따라 약간 달라집니다.
HA
HA 관리자 클러스터에는 3개의 제어 영역 VM이 있습니다. 클러스터 제어 영역을 가져오려면 VM이 2개 이상 있어야 합니다. 3개의 VM이 실패한 경우 실패한 VM을 한 번에 하나씩 복구합니다. 두 번째 VM이 복구되고 실행되면 클러스터 제어 영역이 다시 작동해야 합니다.
다음 명령어를 실행합니다.
gkectl repair admin-master --config ADMIN_CLUSTER_CONFIG --kubeconfig ADMIN_CLUSTER_KUBECONFIG
다음을 바꿉니다.
ADMIN_CLUSTER_CONFIG
: 관리자 클러스터 구성 파일의 경로ADMIN_CLUSTER_KUBECONFIG
를 관리자 클러스터의 kubeconfig 파일 경로로 바꿉니다.
이 명령어 출력은 다음과 비슷합니다.
Please select the control plane VM template to be used for re-creating the admin cluster's control plane VM. [1] VM template: /atl-qual-vc07/vm/gke-admin-57f8g-fx9f4c729448z2v8-2-tmpl GKE on-prem version: 1.16.0-gke.550 Creation time: 2023-07-25 01:52:51.815518 +0000 UTC CPU: 4 CPU(s) Memory: 16384 MB Data disk: [vsanDatastore] 37a73d64-b823-47cd-2e0c-00620b9189a0/gke-admin-57f8g/default/gke-admin-57f8g-2-data.vmdk [2] VM template: /atl-qual-vc07/vm/gke-admin-57f8g-fx9f4c729448z2v8-0-tmpl GKE on-prem version: 1.16.0-gke.550 Creation time: 2023-07-25 01:52:54.228252 +0000 UTC CPU: 4 CPU(s) Memory: 16384 MB Data disk: [vsanDatastore] 37a73d64-b823-47cd-2e0c-00620b9189a0/gke-admin-57f8g/default/gke-admin-57f8g-0-data.vmdk [3] VM template: /atl-qual-vc07/vm/gke-admin-57f8g-fx9f4c729448z2v8-1-tmpl GKE on-prem version: 1.16.0-gke.550 Creation time: 2023-07-25 01:52:54.210705 +0000 UTC CPU: 4 CPU(s) Memory: 16384 MB Data disk: [vsanDatastore] 37a73d64-b823-47cd-2e0c-00620b9189a0/gke-admin-57f8g/default/gke-admin-57f8g-1-data.vmdk Please enter your numeric choice:
복구할 VM의 번호를 입력합니다. 출력에 VM이 표시되지 않으면 Google Cloud 지원팀에 문의하세요.
복구해야 하는 VM이 3개 있는 경우
gkectl repair admin-master
는 첫 번째 VM을 복구한 후 다음과 유사한 오류 메시지를 출력합니다.If you are repairing admin control plane VM for HA admin cluster, it's possible that the API server is still down after repairing one of the VMs. Try continue fixing other control plane VMs listed to recover the quorum of control plane.
이 경우 명령어를 다시 실행하여 두 번째 VM을 복구합니다.
HA 이외
다음 명령어를 실행합니다.
gkectl repair admin-master \ --config ADMIN_CLUSTER_CONFIG \ --kubeconfig ADMIN_CLUSTER_KUBECONFIG
다음을 바꿉니다.
ADMIN_CLUSTER_CONFIG
: 관리자 클러스터 구성 파일의 경로ADMIN_CLUSTER_KUBECONFIG
를 관리자 클러스터의kubeconfig
파일 경로로 바꿉니다.
관리자 클러스터의 제어 영역 VM은 VM을 다시 생성하는 데 필요한 모든 정보가 들어 있는 VM 템플릿에 클론됩니다. gkectl repair admin-master
명령어는 VM 템플릿을 사용하여 새 VM을 만듭니다. 그런 다음 새 부팅 디스크와 기존 데이터 디스크를 연결합니다.
클러스터 노드가 DHCP 서버에서 주소를 가져올 경우 새 VM은 원본 VM과 다른 IP를 보유할 수 있습니다.
다음 단계
- 추가 지원이 필요하면 Cloud Customer Care에 문의하세요.