Kubernetes 클러스터 확인

Stackdriver를 사용하면 단일 대시보드를 통해 Google Kubernetes Engine 클러스터 및 애플리케이션 컨테이너에서 모니터링 및 로깅 정보를 탐색할 수 있습니다.

시작하기

  1. GCP Console에서 Stackdriver > Monitoring을 선택하여 Stackdriver Monitoring 홈페이지로 이동합니다. 다음 버튼을 클릭하면 이 페이지로 이동할 수 있습니다.

    Stackdriver Monitoring 콘솔로 이동

  2. Google Kubernetes Engine 클러스터가 포함된 작업공간을 선택합니다.

    • 대부분의 경우 작업공간은 Google Kubernetes Engine 클러스터가 포함된 Google Cloud Platform 프로젝트입니다.
    • 작업공간을 만들라는 메시지가 표시되거나 GCP 프로젝트가 계정 목록에 표시되지 않을 수 있습니다. 이러한 경우 GCP 프로젝트를 사용하여 새 작업공간을 만들어야 합니다. 자세한 내용은 Stackdriver 계정 만들기를 참조하세요.
    • 여러 프로젝트의 클러스터를 동일한 대시보드에서 모니터링하려면 GCP 프로젝트와 다른 작업공간을 만들어야 합니다. 자세한 내용은 여러 프로젝트 모니터링을 참조하세요.
  3. Kubernetes 모니터링 콘솔로 이동합니다.

    1. 레거시 Stackdriver를 사용 중인 경우 리소스 > Kubernetes Engine을 선택합니다.

    2. Stackdriver Kubernetes Engine Monitoring을 사용 중인 경우 리소스 > Kubernetes Engine 신규를 선택합니다.

      Stackdriver를 사용하는 클러스터가 있는 경우에만 이 메뉴 항목을 볼 수 있습니다.

    Stackdriver Kubernetes Monitoring 콘솔로 이동

    이 콘솔에는 Stackdriver Kubernetes Monitoring을 사용하는 클러스터만 표시됩니다. 클러스터가 표시되지 않거나 클러스터의 모든 리소스가 표시되지 않으면 이 페이지의 문제해결 섹션을 참조하세요.

Stackdriver Kubernetes Engine Monitoring 대시보드 인터페이스

Stackdriver Kubernetes Engine Monitoring 대시보드는 아래 스크린샷에 빨간색 숫자로 표시된 것과 같이 여러 부분으로 나뉩니다.

Kubernetes 표 형식 보기

  1. 대시보드 툴바는 그 아래 표시된 타임라인에 대한 제어 기능, 대시보드 설정, 필터링을 제공합니다.

  2. 타임라인 이벤트 선택기에서는 타임라인 위로 마우스를 가져가서 알림 위반 사항 요약을 표시할 수 있습니다. 아래의 타임라인 이벤트 섹션을 참조하세요.

  3. 세부정보 섹션에서는 세 가지 보기 탭인 인프라, 작업 부하, 서비스 중 하나를 선택할 수 있습니다. 이러한 보기 탭에 대해서는 아래 보기 탭 섹션에서 설명합니다.

보기 탭

대시보드는 클러스터 정보를 여러 방식으로 구성할 수 있는 여러 보기 탭을 제공합니다. 사용 가능한 보기 탭은 다음과 같습니다.

  • 인프라. Kubernetes 리소스를 클러스터 > 노드 > pod > 컨테이너 계층구조로 집계합니다.

  • 작업 부하. Kubernetes 리소스를 클러스터 > 네임스페이스 > 작업 부하 > pod > 컨테이너 계층구조로 집계합니다.

  • 서비스. Kubernetes 리소스를 클러스터 > 네임스페이스 > 서비스 > pod > 컨테이너 계층구조로 집계합니다.

세부사항 섹션 위의 탭에서 보기 모드를 선택할 수 있습니다.

Kubernetes 이벤트 세부정보

이 표는 미해결 이슈가 있는 Kubernetes 리소스를 먼저 표시하도록 정렬되어 있습니다. 각 Kubernetes 리소스 앞에 있는 확장 화살표(▸)를 클릭하면 리소스의 모든 하위 구성요소를 볼 수 있습니다. 다음 스크린샷은 확장된 Kubernetes 리소스 계층구조를 보여줍니다.

Kubernetes 이벤트 세부정보

각 리소스 이름 앞에는 표시기가 붙어 있습니다. 빨간색은 해당 리소스 또는 계층구조의 하위 리소스에 이슈가 발생했음을 나타냅니다. 알림 세부정보를 보려면 이름을 클릭합니다. 자세한 내용은 아래의 알림 세부정보 섹션을 참조하세요.

열 정의

다음은 3개 탭에 표시되는 열에 대한 설명입니다. 표시된 값은 선택된 기간을 기준으로 합니다.

  • 이름: Kubernetes 리소스에 지정한 라벨입니다.
  • 리소스 유형: 가능한 값은 클러스터, 컨테이너, 네임스페이스, 노드, pod, 작업공간입니다.
  • 준비: 사용 가능한 노드 인스턴스 수입니다.
  • 이슈: 알림 위반 수입니다.
  • CPU 사용률: 요청된 CPU 리소스 대비 사용률입니다.
  • 메모리 사용률: 요청된 메모리의 사용률입니다.
  • 총 메모리 사용량: 할당된 메모리 양입니다.

알림 세부정보

Kubernetes Monitoring 대시보드에는 기본적으로 각 Kubernetes 리소스에 대한 요약 행이 표시됩니다. 리소스 세부정보를 보려면 Kubernetes 리소스 앞에 있는 확장 화살표(▸)를 클릭합니다.

항목 앞에 있는 빨간색 또는 녹색 버튼을 클릭하면 알림 세부정보가 포함된 창이 나타납니다.

Kubernetes 이벤트 세부정보

이 세부정보 보기는 하나의 보기 내에서 이슈, 시스템 측정항목, 로그를 집계합니다.

타임라인 이벤트

또한 대시보드 위에 있는 타임라인 이벤트 선택기에서 알림 세부정보 패널에 액세스할 수 있습니다. 이슈 타임라인은 선택된 기간 내에 발생한 알림 위반 사항 보기를 제공합니다. 타임라인에서 빨간색 영역 위로 마우스를 가져가면 이벤트 카드가 나타납니다.

Kubernetes 타임라인 보기

이벤트 카드는 타임라인에 표시된 각 이슈에 대해 자세한 정보를 제공합니다. 개별 이벤트 카드를 클릭하면 해당 이슈에 대한 알림 세부정보가 새 창으로 표시됩니다.

풍선형 차트

Kubernetes Monitoring 대시보드는 측정항목에 표시되는 트렌드 및 패턴을 탐색하는 데 사용되는 풍선 시각화 요소를 제공합니다. 또한 이 대시보드를 통해 클러스터 노드의 상태 정보를 한눈에 볼 수 있습니다.

풍선형 차트 예

차트를 볼 때 다음 정보에 유의하세요.

  • 각 풍선은 노드를 나타내며 플롯 크기는 노드의 pod 수를 나타냅니다.

  • 회색 플롯은 정상적인 노드를 나타냅니다. 빨간색 플롯은 미해결 이슈가 있는 노드를 나타냅니다.

  • 베타 출시 버전에서는 차트 축에 CPU 사용량메모리 사용량을 선택할 수 있습니다. 또한 노드가 GPU를 사용 중인 경우 GPU 사용량을 선택할 수도 있습니다.

문제해결

대시보드에 Kubernetes 리소스가 표시되지 않으면 다음을 확인하세요.

  • 페이지 상단에서 올바른 GCP 프로젝트가 선택되었는지 확인합니다. 그렇지 않다면 페이지 상단의 드롭다운 메뉴를 사용하여 프로젝트를 선택합니다. 보려는 데이터가 포함된 프로젝트를 선택해야 합니다.

  • 프로젝트에 활동이 있는지 확인합니다. 클러스터를 방금 전에 만든 경우, 데이터가 게재될 때까지 몇 분 정도 기다리세요. 자세한 내용은 Stackdriver 지원 설치를 참조하세요.

  • 기간이 너무 짧지 않은지 확인합니다. 페이지 상단에 있는 대시보드 툴바에서 시간 메뉴를 사용하여 다른 기간을 선택하거나 커스텀 범위를 정의할 수 있습니다.

  • 대시보드를 볼 수 있는 적절한 권한이 있는지 확인합니다. 서비스의 배포 세부정보 또는 GCP 프로젝트의 측정항목을 볼 때 다음과 같은 권한 거부 오류 메시지가 표시되면 roles/monitoring.viewer .또는 roles/viewer가 포함되도록 Cloud Identity and Access Management 역할을 업데이트해야 합니다.

    • You do not have sufficient permissions to view this page
    • You don't have permissions to perform the action on the selected resources

    자세한 내용을 보려면 사전 정의된 역할로 이동합니다.

  • 클러스터의 서비스 계정에 Stackdriver에 데이터를 쓸 수 있는 권한이 있는지 확인합니다. API 대시보드에서 오류가 자주 발생한다면 서비스 계정에 다음 역할이 없는 것일 수 있습니다.

    • metricWriter
    • logWriter
    • Stackdriver 리소스 메타데이터 작성자
이 페이지가 도움이 되었나요? 평가를 부탁드립니다.

다음에 대한 의견 보내기...

Stackdriver Monitoring
도움이 필요하시나요? 지원 페이지를 방문하세요.