이 페이지는 Cloud Translation API를 통해 번역되었습니다.

GKE의 관측 가능성

Autopilot Standard

이 페이지에서는 애플리케이션 상태를 이해하고 애플리케이션 가용성 및 안정성을 유지하는 방법을 설명합니다.

기본 관측 가능성 기능

기본적으로 GKE 클러스터는 다음을 수행하도록 구성됩니다.

시스템 로그, 감사 로그, 애플리케이션 로그를 Cloud Logging에 전송합니다.
Cloud Monitoring에 시스템 측정항목을 전송합니다.
Google Cloud Managed Service for Prometheus를 사용해서 구성된 타사 및 사용자 정의 측정항목을 수집하고 이를 Cloud Monitoring에 전송합니다. Google Cloud Managed Service for Prometheus를 사용하면, 대규모 Prometheus를 수동으로 관리 및 운영할 필요 없이 Prometheus를 사용하여 워크로드를 모니터링하고 알림을 보낼 수 있습니다.

데이터 수집 맞춤설정 및 강화

기본적으로 GKE는 각 클러스터의 로그를 저장하기 위한 Logging 저장소를 만듭니다. GKE 클러스터에서 Cloud Logging 및 Cloud Monitoring으로 전송되는 로그 및 측정항목을 제어할 수 있습니다.

또한 Google Cloud Managed Service for Prometheus를 사용 설정할지 여부를 제어할 수 있습니다.

GKE Autopilot 클러스터의 경우 Cloud Monitoring 및 Cloud Logging 통합을 사용 중지할 수 없습니다.

추가 관측 가능성 측정항목

하나 이상의 관측 가능성 측정항목 패키지를 사용 설정하여 추가적인 관측 가능성 측정항목을 수집할 수 있습니다.

제어 영역 측정항목: Kubernetes API 서버, 스케줄러, 컨트롤러 관리자에 대해 측정항목을 수집하여 Kubernetes 구성요소의 상태를 모니터링합니다. 이러한 측정항목은 서비스 수준 목표(SLO)를 정의하는 데 유용한 서비스 상태 신호입니다.
Kubernetes 상태 측정항목: 배포, 노드, 포드와 같은 Kubernetes 객체의 상태를 모니터링합니다.
cAdvisor/Kubelet 측정항목: 컨테이너와 kubelet의 상태를 모니터링합니다.

타사 및 사용자 정의 측정항목

Postgres, MongoDB, Redis와 같이 클러스터에서 실행되는 타사 애플리케이션을 모니터링하려면 Google Cloud Managed Service for Prometheus와 함께 Prometheus 내보내기 도구를 사용합니다.

또한 맞춤 내보내기 도구를 작성하여 상태 및 성능의 다른 신호를 모니터링할 수 있습니다.

수집된 데이터 사용

애플리케이션을 개발, 배포, 유지보수할 때 수집한 데이터를 사용해서 애플리케이션 상태 분석, 디버그, 문제 해결, 테스트를 수행할 수 있습니다.

GKE는 빠르게 시작할 수 있도록 기본 제공되는 관측 가능성 기능을 제공합니다.

GKE 관측 가능성 대시보드에서 클러스터 및 워크로드에 대해 수집된 데이터를 확인합니다. 다음 목적으로 제공된 대시보드를 맞춤설정할 수 있습니다.
- CPU 사용률, 메모리 사용률, 미해결된 이슈 수와 같은 주요 클러스터 측정항목을 확인합니다.
- 인프라, 워크로드 또는 서비스별로 클러스터를 확인합니다.
- 네임스페이스, 노드, 워크로드, 서비스, 포드, 컨테이너를 조사합니다.
- 포드 및 컨테이너에 대해 시간별 측정항목과 로그 항목을 확인합니다.
필요에 따라 자체 대시보드 만들기 또는 Grafana 대시보드 가져오기를 수행할 수 있습니다.

참고: 제공된 GKE 대시보드는 Google Cloud에서 실행되는 GKE 클러스터의 정보만 표시합니다. 온프레미스 또는 베어메탈 서버 사용과 같이 다른 곳에서 실행되는 GKE 클러스터에 대한 정보는 표시되지 않습니다.
관측 가능성 탭에서 이슈에 대한 알림을 받도록 권장사항에 따라 알림 정책을 만들 수 있습니다. 알림에 대한 자세한 내용은 알림 개요를 참조하세요.
수집된 GKE 측정항목을 사용해서 서비스 성능 목표를 모니터링하려면 SLO를 만듭니다.
예약되지 않은 포드 및 다시 시작 후 반복적으로 다운되는 컨테이너와 같은 일반적인 문제를 해결하려면 GKE 플레이북을 사용합니다.
로그 탐색기, 측정항목 탐색기, Error Reporting과 같은 도구를 사용해서 데이터를 탐색하고 분석합니다.
Cloud 감사 로그의 일부로 관리 활동 및 액세스를 기록하는 GKE 감사 로그를 검토합니다. 감사 로그 정책에 따라 기록할 이벤트가 결정되고 특정 로그 항목이 관리자 활동 로그 또는 데이터 액세스 로그에 속하는지 여부가 결정됩니다.

기타 특성

GKE는 다른 Google Cloud 서비스와 통합되어 클러스터 및 워크로드를 모니터링하고 관리할 수 있게 도와줍니다.

보안 상황 대시보드에서는 표준 및 업계 권장사항에 따라 보안 문제를 식별할 수 있습니다.
클러스터 최적화에 대한 인사이트 및 권장사항을 확인합니다.
네트워크 정책 로깅을 사용하면 Kubernetes 네트워크 정책 관련 문제를 해결하는 데 도움이 됩니다. GKE Dataplane V2를 사용하는 경우 네트워크 정책 로깅이 기본 제공됩니다.

가격 책정

Cloud Logging(Cloud 감사 로그 포함), Cloud Monitoring, Google Cloud Managed Service for Prometheus와 통합에 대한 가격 책정은 수집되는 로그 및 측정항목의 양에 따라 달라집니다. 자세한 내용은 가격 책정 페이지를 참조하세요.

기타 기능에 나열된 다른 Google Cloud 서비스에서 제공되는 기능에는 각기 다른 가격 책정이 적용됩니다. 자세한 내용은 해당 문서 페이지의 가격 책정 섹션을 참조하세요.

다음 단계

클러스터를 관찰합니다. 대시보드를 보고, 클러스터 정보를 구성하고, 알림 세부정보를 확인하는 방법을 알아보세요.
GKE 클러스터 노드에서 자세한 OS 수준 감사 로깅을 사용 설정하고 Cloud Logging으로 로그를 내보내는 방법을 알아봅니다.
관측 가능성 기능을 사용하여 GKE 문제를 해결하는 방법에 대한 자세한 내용은 Cloud Logging으로 기록 분석 실행 및 Cloud Monitoring으로 사전 모니터링 실행을 참고하세요.