GKE 클러스터 관찰

이 페이지에서는 Cloud Operations for GKE와 기존 Logging 및 Monitoring 모니터링 대시보드에 액세스하는 방법과 Cloud Operations for GKE 모니터링 대시보드를 사용하는 방법을 설명합니다.

모니터링 대시보드에 액세스

  1. Cloud Console에서 Monitoring으로 이동합니다.

    Monitoring으로 이동

  2. 대시보드를 선택한 후 다음 대시보드 중 하나를 선택합니다.

    • Cloud Operations for GKE가 사용 설정된 클러스터의 경우 GKE라는 대시보드를 선택합니다.

    • 기존 Logging 및 Monitoring이 사용 설정된 클러스터의 경우 GKE 클러스터라는 대시보드를 선택합니다.

    클러스터가 표시되지 않거나 클러스터에 모든 리소스가 표시되지 않으면 GKE 대시보드 문제 해결을 참조하세요.

Cloud Operations for GKE 대시보드 인터페이스

Cloud Operations for GKE 대시보드는 세 부분으로 나뉩니다.

Cloud Operations for GKE 대시보드의 테이블 형식의 뷰를 표시합니다.

  1. 필터 표시줄을 사용하면 대시보드 내에서 필터링할 GKE 리소스를 선택할 수 있습니다.

  2. 알림 타임라인을 사용하여 대시보드의 특정 기간을 선택할 수 있으며 이 시간 범위 동안 알림 요약을 표시합니다.

  3. 테이블에는 클러스터, 네임스페이스, 노드, 워크로드, 서비스, pod, 컨테이너 등 GKE 제품군이 유형별로 표시됩니다. 각 행에는 측정항목이 있는 단일 리소스가 표시됩니다. 행을 클릭하면 해당 리소스에 대한 세부정보가 있는 패널이 표시됩니다.

필터 표시줄

필터 표시줄을 사용하면 대시보드에 표시되는 GKE 리소스를 필터링하여 관심 있는 데이터를 표시할 수 있습니다. 또한 필터 선택과 관련된 클러스터의 다른 리소스 정보도 표시됩니다.

필터 표시줄 사용

대시보드에서 데이터를 필터링하려면 다음 단계를 완료하세요.

  1. 필터 표시줄을 클릭하여 필터 옵션을 표시합니다.

    필터 옵션을 표시합니다.

  2. 필터링할 Kubernetes 리소스를 선택한 후 리소스 이름을 선택합니다.

    이 이름의 리소스가 두 개 이상 있다면 필터링할 특정 리소스 인스턴스를 선택합니다.

  3. 적용을 클릭합니다.

    대시보드가 새로고침되어 업데이트된 정보를 표시합니다.

필터 표시줄을 사용할 때 다음 사항에 유의하세요.

  • 대시보드에 필터를 적용한 후에는 필터 표시줄을 다시 클릭하여 추가 리소스를 필터링할 수 있습니다.

  • 일부 리소스는 필터 메뉴에 표시되는 옵션이 너무 많을 수 있습니다. 이 경우 먼저 상위 리소스를 필터링하여 옵션의 범위를 좁혀 나가야 합니다. 예를 들어 표시할 Pod가 너무 많으면 먼저 클러스터 또는 다른 Kubernetes 리소스로 필터링하여 Pod 목록의 범위를 좁혀 나갈 수 있습니다.

  • 각 필터 문자열의 범위를 명확히 하기 위해 필터 인터페이스는 필터링하려는 리소스에 따라 기본적으로 추가 필터를 표시할 수 있습니다. 예를 들어 특정 네임스페이스를 필터링하면 필터는 네임스페이스가 있는 클러스터를 추가합니다.

    시스템에서 선택한 추가 필터 옵션을 표시합니다.

알림 타임라인

알림 타임라인은 클러스터의 알림 뷰를 제공합니다. 알림 타임라인은 선택한 기간 내에 발생한 알림 위반사항 뷰를 제공합니다. 타임라인의 빨간색 영역에 포인터를 놓으면 이벤트 카드가 표시됩니다.

Kubernetes 알림의 타임라인 보기 사용

각 이벤트 카드는 타임라인에 표시된 하나의 알림에 대한 자세한 정보를 제공합니다.

시간 범위 드롭다운 메뉴를 사용하면 알림 타임라인과 대시보드의 테이블에 대한 기간을 설정할 수 있습니다.

이벤트 카드 사용

알림 타임라인 위로 마우스를 가져가면 대시보드에 각 알림 위반에 대한 이벤트 카드가 표시됩니다. 가 있는 알림은 이슈가 아직 미해결 상태임을 나타내고 가 있는 알림은 이슈가 종료되었음을 나타냅니다.

선택한 기간에 알림이 2개를 초과하는 경우 마우스 휠을 사용하여 이벤트 카드를 스크롤할 수 있습니다. 모든 알림 보기를 클릭하여 모든 이벤트 카드를 패널에 표시할 수도 있습니다.

알림에서 알림 이슈를 보려면 이슈 보기를 클릭합니다.

연결된 리소스 섹션에서 이벤트 카드는 알림이 연결된 리소스를 보여줍니다. 대시보드에서 알림이 연결된 리소스를 확인할 수 없는 경우 이벤트 카드에서알림 정책 업데이트 링크를 표시하고 링크를 통해 알림 정책 수정 페이지로 이동합니다. 여기에서 대시보드가 관련 리소스를 찾을 수 있도록 추가 정보로 알림 정책을 업데이트할 수 있습니다.

대시보드 테이블

대시보드에 각 GKE 리소스의 측정항목 테이블이 표시됩니다. 표에는 다음 열이 표시됩니다.

  • 이름: 리소스의 표시 이름입니다.

  • 알림: 선택한 기간 동안 해당 리소스 및 해당 하위 요소에 대해 공개 알림 및 확인된 알림 수입니다.

  • 서비스 수준 목표(SLO): 선택한 서비스 수준 지표(SLI)를 통해 측정된 서비스의 원하는 성능에 대한 문입니다.

  • 컨테이너 다시 시작: 선택한 기간 내에 컨테이너가 다시 시작된 횟수입니다.

  • 오류 로그: 선택한 기간을 기준으로 항목과 관련된 오류 로그 수입니다.

  • CPU 사용률: 선택한 기간 내에 리소스로 인해 발생할 수 있는 컨테이너의 CPU 사용률입니다.

  • 메모리 사용률: 선택한 기간 내에 리소스로 인해 발생할 수 있는 컨테이너의 메모리 사용률입니다.

  • 디스크 사용률: 선택한 기간 내에 리소스로 인해 발생할 수 있는 pod의 디스크 사용률입니다. 이전 두 열과 달리 이 측정항목은 pod에서 생성되며 컨테이너 테이블에 표시되지 않습니다.

사용률 열의 경우 다음 정보에 주의하세요.

  • 이 열에는 비율이 표시되지 않지만 /로 구분된 2개의 서로 다른 데이터 포인트가 표시됩니다. 첫 번째 숫자는 해당 개별 리소스에 요청된 총 용량을 나타냅니다. 두 번째 숫자는 요청된 용량의 사용률을 보여줍니다.

  • 스파크라인은 페이지에서 선택한 기간 동안의 사용률 데이터를 표시합니다.

대시보드 테이블 구성

대시보드에서 테이블을 구성하여 가장 관심 있는 정보를 표시할 수 있습니다. 필터 표시줄 옆에 있는 리소스 테이블 구성 드롭다운 메뉴를 사용하면 표시할 열을 선택할 수 있습니다. 테이블에 스파크라인을 표시할지 여부도 선택할 수 있습니다.

이러한 구성은 대시보드의 모든 테이블에 적용됩니다.

리소스 테이블 구성 드롭다운 메뉴가 표시됩니다.

테이블을 구성하려면 다음 단계를 완료합니다.

  1. 리소스 테이블 구성 드롭다운 메뉴를 선택합니다.

  2. 테이블에 표시할 열을 선택합니다.

    이름활성 알림 열은 필수 열입니다.

  3. 스파크라인 표시 여부를 선택합니다.

  4. 적용을 클릭하여 변경합니다.

리소스 세부정보 보기

Cloud Operations for GKE 대시보드는 기본적으로 각 Kubernetes 리소스의 요약 줄을 표시합니다. 테이블의 행을 클릭하면 해당 리소스의 세부정보가 표시됩니다.

리소스 세부정보 표시

리소스 세부정보 패널에는 선택한 리소스에 대한 정보가 표시됩니다. 또한 공개 알림에 대한 정보를 표시하는 알림 탭, 선택한 리소스와 연결된 Kubernetes 이벤트를 표시하는 이벤트 탭, 차트에 측정항목을 표시하는 측정항목 탭, 리소스에서 생성된 로그를 표시하는 로그 탭도 제공됩니다.

알림에서 알림 이슈를 보려면 알림 보기를 클릭합니다.

Kubernetes 이벤트 보기

리소스 세부정보 패널의 이벤트 탭에 리소스와 연결된 Kubernetes 이벤트가 표시됩니다. Kubernetes 이벤트는 컨테이너를 제외한 모든 리소스에 사용할 수 있습니다.

리소스 세부정보의 이벤트 탭 표시

이벤트 탭에는 각 이벤트에 대한 정보를 표시하는 일련의 카드가 있습니다. 이벤트가 하위 리소스에서 발생하면 카드는 관련 리소스로 연결되는 링크도 제공합니다. 로그 보기를 클릭하여 로그 탐색기를 열고 이벤트와 연결된 로그를 볼 수 있습니다. 메시지 복사를 클릭하여 로그 메시지를 클립보드에 복사할 수도 있습니다.

로그 탐색기에서 모든 이벤트를 보려면 Logging에서 보기를 클릭합니다. 로그 탐색기가 열리고 Kubernetes 이벤트와 연결된 모든 로그가 표시됩니다.

SLO 관리

서비스 수준 목표(SLO)를 사용하여 애플리케이션의 상태와 성능을 추적할 수 있습니다. 서비스 수준 목표(SLO) 열을 표시하도록 대시보드를 구성하면 애플리케이션에서 SLO를 충족하는지를 확인할 수 있습니다. 리소스 SLO는 다음 상태 중 하나일 수 있습니다.

  • 정상: 리소스가 지정된 SLO를 충족합니다. 이 상태는 녹색 표시기로 표시됩니다.

  • 오류 예산 부족: 리소스가 오류 예산을 소진했습니다. 즉, 불량 이벤트가 추가되어 리소스가 SLO를 위반할 수 있습니다. 이 상태는 노란색 표시기로 표시됩니다.

  • 비정상: 리소스가 SLO에서 벗어나고 실행된 알림이 있습니다. 이 상태는 빨간색 표시기로 표시됩니다.

  • 상태 없음: SLO에 대한 데이터가 없습니다. 이 상태는 회색 표시기로 표시됩니다.

이러한 개념에 대한 자세한 내용은 서비스 모니터링 개념을 참조하세요.

SLO 세부정보

네임스페이스, 워크로드, Kubernetes 서비스 등의 Kubernetes 리소스에만 SLO를 정의할 수 있습니다. 리소스의 SLO 규정 준수에 대한 자세한 내용을 확인하려면 리소스를 클릭하여 세부정보 패널을 엽니다. 세부정보 패널에서 SLO 탭을 클릭합니다.

세부정보 패널의 SLO 탭을 표시합니다.

SLO 만들기

Cloud Operations for GKE 모니터링 대시보드에서 Kubernetes 리소스의 SLO를 만들 수 있습니다.

GKE 대시보드 페이지에서 Kubernetes 리소스 행의 를 클릭하여 서비스 수준 목표(SLO) 만들기 패널을 엽니다.

리소스의 세부정보 패널에서 SLO 만들기를 클릭하여 서비스 수준 목표(SLO) 만들기 패널을 엽니다.

SLO 생성 패널을 표시합니다.

SLO 만들기 양식 작성은 SLO 만들기 가이드를 참조하세요.

로그 탐색기에서 로그 보기

로그 탐색기를 통해 클러스터의 로그 데이터를 검색하고 볼 수 있습니다. 로그 탐색기를 사용하면 로그를 보고 로그 데이터를 파싱 및 분석하고 쿼리 매개변수를 상세검색할 수 있습니다.

Logging 문서에서 로그 탐색기 사용에 대한 자세한 내용을 확인할 수 있습니다.

문제 해결하기

문제 해결 정보는 GKE 대시보드 문제 해결을 참조하세요.