클러스터 상태 확인

이 페이지는 플랫폼 관리자용으로 작성되었습니다.

이 페이지에서는 클러스터의 노드, 시스템 포드, 네트워크 연결 상태를 확인하는 방법을 설명합니다.

actl을 사용하여 클러스터 상태 확인

다음 명령어를 실행하여 클러스터의 상태를 확인합니다.

actl clusters baremetal check cluster CLUSTER_NAME --kubeconfig=ADMIN_KUBECONFIG

이 명령어는 다음을 확인합니다.

  • kubelet 실행 상태, containerd 상태, 디스크 용량, 레지스트리 미러링 연결 가능성과 같은 클러스터 내 노드의 상태 등
  • 클러스터가 관리자 클러스터인 경우 anthos-cluster-operator와 같은 베어메탈 시스템 포드의 상태
  • 노드 간 네트워크 연결(예: 마스터 노드 간 L2 연결)

다음은 성공적인 상태 확인의 예시입니다.

Please check the logs at actl-workspace/user-1/log/check-cluster-20210616-215509/check-cluster.log
[2021-06-16 21:55:16+0000] Waiting for health check job to finish... OK
[2021-06-16 21:55:46+0000] - Validation Category: machines, network, add-ons and kubernetes
[2021-06-16 21:55:46+0000]  - [PASSED] add-ons
[2021-06-16 21:55:46+0000]  - [PASSED] kubernetes
[2021-06-16 21:55:46+0000]  - [PASSED] node-network
[2021-06-16 21:55:46+0000]  - [PASSED] 10.200.0.6
[2021-06-16 21:55:46+0000]  - [PASSED] 10.200.0.7
[2021-06-16 21:55:46+0000]  - [PASSED] 10.200.0.8
[2021-06-16 21:55:46+0000] Flushing logs... OK

다음은 실패한 상태 확인의 예시입니다.

Please check the logs at actl-workspace/user-1/log/check-cluster-20210807-001826/check-cluster.log
[2021-08-07 00:18:32+0000] Waiting for health check job to finish... OK
[2021-08-07 00:20:52+0000] - Validation Category: machines, network, add-ons and kubernetes
[2021-08-07 00:20:52+0000]  - [FAILED] 10.200.0.6
      actl-workspace/user-1/log/check-cluster-20210807-001826/10.200.0.6
[2021-08-07 00:20:52+0000]  - [FAILED] 10.200.0.7
      actl-workspace/user-1/log/check-cluster-20210807-001826/10.200.0.7
[2021-08-07 00:20:52+0000]  - [FAILED] 10.200.0.8
      actl-workspace/user-1/log/check-cluster-20210807-001826/10.200.0.8
[2021-08-07 00:20:52+0000]  - [PASSED] add-ons
[2021-08-07 00:20:52+0000]  - [PASSED] kubernetes
[2021-08-07 00:20:52+0000]  - [PASSED] node-network
[2021-08-07 00:20:52+0000] Flushing logs... OK
[2021-08-07 00:20:52+0000] Error waiting for health check job: health check failed

다음 단계