GKE의 관측 가능성


이 페이지에서는 애플리케이션 상태를 이해하고 애플리케이션 가용성 및 안정성을 유지하는 방법을 설명합니다.

GKE 클러스터를 만들면 Cloud Logging, Cloud Monitoring, Google Cloud Managed Service for Prometheus가 기본적으로 사용 설정되며 Kubernetes용으로 특별히 맞춤설정된 관측 가능성을 제공합니다.

  • 기본 제공 대시보드를 사용해서 기본 측정항목 및 로그를 보고 권장 알림을 설정합니다.
  • Kubernetes 구성요소 및 객체를 모니터링하고 디버깅 및 문제 해결을 위해 수집된 데이터를 사용하도록 추가 관측 가능성 패키지를 사용 설정합니다.
  • 클러스터에서 실행 중인 타사 애플리케이션에 대한 데이터 수집을 구성합니다.
  • 필요에 맞게 고유한 측정항목, 대시보드, 알림을 정의합니다.

Cloud Logging 및 Cloud Monitoring과의 통합 외에도 GKE는 애플리케이션 상태를 관측하고 유지보수하는 데 도움이 되는 기타 기능을 제공합니다.

기본 관측 가능성 기능

기본적으로 GKE 클러스터는 다음을 수행하도록 구성됩니다.

데이터 수집 맞춤설정 및 강화

GKE 클러스터에서 Cloud Logging 및 Cloud Monitoring으로 전송되는 로그 및 측정항목을 제어할 수 있습니다.

또한 Google Cloud Managed Service for Prometheus를 사용 설정할지 여부를 제어할 수 있습니다. 구성 안내는 GKE의 로깅 및 모니터링 구성을 참조하세요.

GKE Autopilot 클러스터의 경우 Cloud Monitoring 및 Cloud Logging 통합을 사용 중지할 수 없습니다.

추가 관측 가능성 측정항목

하나 이상의 관측 가능성 측정항목 패키지를 사용 설정하여 추가적인 관측 가능성 측정항목을 수집할 수 있습니다.

  • 제어 영역 측정항목: Kubernetes API 서버, 스케줄러, 컨트롤러 관리자에 대해 측정항목을 수집하여 Kubernetes 구성요소의 상태를 모니터링합니다. 이러한 측정항목은 서비스 수준 목표(SLO)를 정의하는 데 유용한 서비스 상태 신호입니다.
  • Kubernetes 상태 측정항목: 배포, 노드, 포드와 같은 Kubernetes 객체의 상태를 모니터링합니다.

프로젝트에서 GKE Enterprise를 사용 설정했으면 클러스터를 만드는 동안 Fleet에 등록할 때 이러한 측정항목이 기본적으로 사용 설정됩니다.

타사 및 사용자 정의 측정항목

Postgres, MongoDB, Redis와 같이 클러스터에서 실행되는 타사 애플리케이션을 모니터링하려면 Google Cloud Managed Service for Prometheus와 함께 Prometheus 내보내기 도구를 사용합니다.

또한 다른 상태 및 성능 신호를 모니터링할 수 있도록 커스텀 내보내기 도구를 작성할 수 있습니다.

수집된 데이터 사용

애플리케이션을 개발, 배포, 유지보수할 때 수집한 데이터를 사용해서 애플리케이션 상태 분석, 디버그, 문제 해결, 테스트를 수행할 수 있습니다.

GKE는 빠르게 시작할 수 있도록 기본 제공되는 관측 가능성 기능을 제공합니다.

  • GKE 관측 가능성 대시보드에서 클러스터 및 워크로드에 대해 수집된 데이터를 확인합니다. 다음 목적으로 제공된 대시보드를 맞춤설정할 수 있습니다.

    • CPU 사용률, 메모리 사용률, 미해결된 이슈 수와 같은 주요 클러스터 측정항목을 확인합니다.
    • 인프라, 워크로드 또는 서비스별로 클러스터를 확인합니다.
    • 네임스페이스, 노드, 워크로드, 서비스, 포드, 컨테이너를 조사합니다.
    • 포드 및 컨테이너에 대해 시간별 측정항목과 로그 항목을 확인합니다.

    필요에 따라 자체 대시보드 만들기 또는 Grafana 대시보드 가져오기를 수행할 수 있습니다.

  • 관측 가능성 탭에서 이슈에 대한 알림을 받도록 권장사항에 따라 알림 정책을 만들 수 있습니다. 알림에 대한 자세한 내용은 알림 개요를 참조하세요.

  • 수집된 GKE 측정항목을 사용해서 서비스 성능 목표를 모니터링하려면 SLO를 만듭니다.

  • 예약되지 않은 포드다시 시작 후 반복적으로 다운되는 컨테이너와 같은 일반적인 문제를 해결하려면 GKE 플레이북을 사용합니다.

  • 로그 탐색기, 측정항목 탐색기, Error Reporting과 같은 도구를 사용해서 데이터를 탐색하고 분석합니다.

  • Cloud 감사 로그의 일부로 관리 활동 및 액세스를 기록하는 GKE 감사 로그를 검토합니다. 감사 로그 정책에 따라 기록할 이벤트가 결정되고 특정 로그 항목이 관리자 활동 로그 또는 데이터 액세스 로그에 속하는지 여부가 결정됩니다.

기타 기능

GKE는 다른 Google Cloud 서비스와 통합되어 클러스터 및 워크로드를 모니터링하고 관리할 수 있게 도와줍니다.

가격 책정

Cloud Logging(Cloud 감사 로그 포함), Cloud Monitoring, Google Cloud Managed Service for Prometheus와 통합에 대한 가격 책정은 수집되는 로그 및 측정항목의 양에 따라 달라집니다. 자세한 내용은 가격 책정 페이지를 참조하세요.

기타 기능에 나열된 다른 Google Cloud 서비스에서 제공되는 기능에는 각기 다른 가격 책정이 적용됩니다. 자세한 내용은 해당 문서 페이지의 가격 책정 섹션을 참조하세요.

다음 단계