클러스터 문제 진단

상태 점검 기능은 클러스터 컨트롤 플레인의 상태와 몇 가지 중요한 구성요소를 정기적으로 모니터링하고 클러스터와 관련된 잠재적인 문제를 감지 및 진단하는 데 유용합니다.

추가 지원이 필요하면 Cloud Customer Care에 문의하세요.

문제가 감지됨

클러스터 상태 점검기는 클러스터의 다음 문제를 감지하고 알립니다.

  • 컨트롤 플레인 노드의 kube-scheduler 상태: kube-scheduler 비정상으로 인해 클러스터가 포드를 노드에 할당하는 데 문제가 있음을 나타냅니다. 추가 조사를 위해 kube-scheduler 포드 로그를 검사할 수 있습니다.

  • 컨트롤 플레인 노드의 kube-controller-manager 상태: kube-controller-manager는 특히 ReplicaSet, 배포, 네임스페이스 컨트롤러와 같은 다양한 컨트롤러를 모니터링합니다. kube-controller-manager가 비정상으로 간주되는 경우 관리하는 컨트롤러 중 하나 이상이 제대로 작동하지 않을 수 있습니다. 정확한 문제를 확인하려면 kube-controller-manager 포드 로그를 조사하여 오작동하는 컨트롤러에 대한 자세한 정보를 확인할 수 있습니다.

  • 루트 볼륨 용량: 상태 점검기가 각 컨트롤 플레인 노드의 루트 볼륨에 용량이 충분한지 확인합니다. 사용 가능한 용량이 512MB 미만으로 떨어지면 상태 점검기가 디스크 공간 부족 가능성에 대해 알려줍니다.

상태 점검 이벤트 보기

특정 클러스터의 상태 점검기에서 알림을 보려면 다음 명령어를 실행합니다.

gcloud container aws clusters describe CLUSTER_NAME \
    --location GOOGLE_CLOUD_LOCATION

다음을 바꿉니다.

  • CLUSTER_NAME: 클러스터 이름
  • GOOGLE_CLOUD_LOCATION: 클러스터를 관리하는 Google Cloud 위치의 이름

다음은 예상할 수 있는 출력 유형의 일부입니다.

{
  "name": "some-cluster-name",
  "description": "test-cluster",
  ...
  "errors": [
  {
    "message": "Replica (replica-name)": kube-controller-manager is unhealthy"
  },
  {
    "message": "Replica (replica-name)": not enough disk space on root volume, only 9 MB left"
  }
  ]
  ...
}

이 예시에서 오류 메시지는 kube-controller-manager 구성요소가 비정상이고 제어 영역 노드의 루트 볼륨의 용량이 낮아지고 있음을 나타냅니다.

다음 단계

추가 지원이 필요하면 Cloud Customer Care에 문의하세요.