GKE Enterprise 개요 사용

Google Cloud 콘솔의 GKE Enterprise 개요 대시보드는 Fleet의 "대략적인" 개요를 제공합니다. 이 개요는 Fleet에 포함된 보안 문제 수, Fleet 전반의 정책 컨트롤러 적용 범위, 구성 동기화 패키지의 동기화 상태를 표시하여 GKE Enterprise 기능을 사용하는 데 도움이 됩니다. 또한 이 대시보드는 Fleet 수준에서 Fleet, 클러스터, 팀의 리소스 사용률 보기를 제공합니다. 이 정보를 사용하여 지출, 애플리케이션 디자인, 리소스 할당(CPU, 메모리, 디스크 사용률 등)을 최적화할 수 있습니다.

이 문서를 읽기 전에 포드 및 컨테이너의 리소스 관리 Kubernetes 문서에 설명된 Kubernetes 리소스 관리를 숙지해야 합니다.

Google Cloud 콘솔에서 GKE Enterprise 개요는 GKE Enterprise를 사용 설정한 Fleet 사용자만 사용할 수 있습니다.

개요 보기

개요 대시보드를 보려면 다음 안내를 따르세요.

시간 필터 선택

기본적으로 GKE Enterprise 개요에는 이전 1시간 동안의 리소스 사용률이 표시됩니다. 이 기간을 변경하려면 시간 필터 옵션을 사용합니다.

  • Fleet 컨테이너의 평균 리소스 사용률을 보려는 기간을 선택합니다. 사전 정의된 옵션 중 하나를 선택하거나 커스텀을 선택하여 커스텀 기간을 지정합니다.

클러스터, 팀 범위, 총 리소스 사용률 보기

첫 번째 섹션에서는 선택한 기간 동안 클러스터, 팀 범위, 총 CPU/메모리/디스크 사용률에 대한 대략적인 보기가 제공됩니다. 리소스 사용률 측정항목은 Fleet 클러스터의 시스템 Cloud Monitoring 데이터를 사용하여 생성됩니다.

데이터 누락 알림이 표시되면 Fleet 클러스터에 대한 시스템 Cloud Monitoring 사용 설정 섹션을 참조해서 문제를 해결합니다.

클러스터 상태 보기

이 Fleet의 클러스터 섹션에서 Fleet에 있는 클러스터 수를 확인할 수 있습니다. Fleet에 대한 클러스터 연결에 문제가 있으면 경고 또는 오류가 표시됩니다. 예를 들어 먼저 등록을 취소하지 않고 클러스터를 삭제했거나 또는 세부정보를 보기 위해 Google Cloud 외부의 클러스터에 로그인해야 할 수 있습니다.

  • 오류나 경고가 표시되면 알림을 클릭하여 문제가 있는 클러스터를 확인하고 문제를 해결합니다.
  • 전체 클러스터 보기를 클릭하여 Fleet의 전체 클러스터 목록을 확인합니다.

팀 범위 보기

팀 범위 섹션에서 이 Fleet에 있는 팀 범위 수를 확인할 수 있습니다. 팀 범위를 사용하면 팀별로 Fleet 리소스 하위 집합을 정의할 수 있습니다. 이러한 범위를 정의한 후 각 팀이 Fleet에서 개별 "테넌트"로 작동할 수 있도록 팀 관리 기능을 사용할 수 있습니다.

  • Fleet에서 전체 팀 범위 목록을 보려면 모든 팀 범위 보기를 클릭합니다.

총 리소스 사용률 보기

총 리소스 사용률 섹션에서는 이 Fleet의 클러스터 노드 간에 할당 가능한 리소스를 기준으로 모든 Fleet 컨테이너의 실제 CPU, 메모리, 디스크 리소스의 평균 사용량을 보여줍니다. 선택한 기간 동안의 데이터가 표시됩니다. Kubernetes 노드의 할당 가능은 해당 노드의 일반 포드에서 사용할 수 있는 리소스의 양으로 정의됩니다.

이 뷰에서는 Fleet의 리소스 사용률과 사용 가능한 리소스를 간략하게 살펴보고 더 자세한 측정항목으로 조사하도록 가능한 문제가 표시될 수 있습니다. 예를 들어 총 CPU 사용률이 매우 낮은 경우 "클러스터별" 측정항목을 사용하여 크기를 조절할 수 있는 클러스터를 확인할 수 있습니다.

기능 관리 보기

보안 문제 보기

활성 취약점 또는 워크로드 구성 문제와 같이 Fleet 멤버 클러스터에 영향을 주는 보안 문제를 식별하기 위해서는 보안 문제 섹션을 확인합니다. 이 섹션에서는 다음 정보를 보여줍니다.

  • Fleet에서 발견된 문제의 총 개수입니다. 문제는 심각도에 따라 그룹화되며 CVSS 수량적 심각도 등급 척도를 기준으로 심각도가 할당됩니다.
  • 유형별 문제 분석. 구성 문제, 보안 게시판, 취약점 등 문제의 원인을 식별하는 데 도움이 됩니다.

GKE 보안의 개요를 보고 확인된 문제를 해결하는 방법에 대한 실행 가능한 조언을 보려면 보안 상황 보기를 클릭합니다. 이전에 보안 상황 대시보드를 사용하지 않았으면 보안 상황 사용 설정을 클릭하여 Container Security API를 사용 설정하고 보안 상황 대시보드에 액세스합니다.

자세한 내용은 보안 상황 대시보드 정보를 참조하세요.

정책 컨트롤러 적용 범위 보기

정책 컨트롤러를 사용 설정하면 클러스터에 완전히 프로그래밍 가능한 정책을 적용할 수 있습니다. 이러한 정책은 '가드레일' 역할을 하며 Kubernetes API 구성에 대한 변경이 조직의 보안, 운영 또는 규정 준수 제어를 위반하는 것을 방지합니다.

정책 상태 섹션에는 정책 컨트롤러가 사용 설정된 클러스터 수가 표시됩니다.

정책 보기를 클릭하여 정책 컨트롤러 대시보드를 확인합니다. 클러스터에 정책 컨트롤러를 설치하지 않았으면 정책 사용 설정을 클릭합니다.

정책 컨트롤러에 대한 자세한 내용은 해당 문서를 참조하세요.

구성 동기화 패키지 상태 보기

구성 동기화는 클러스터 운영자 및 플랫폼 관리자가 정보 소스로부터 패키지를 배포할 수 있게 해주는 GitOps 서비스입니다. 패키지에는 클러스터를 동기화하는 각 소스에 포함된 모든 구성이 포함됩니다. 소스는 Git 저장소, Git 저장소의 디렉터리, OCI 이미지, Helm 저장소일 수 있습니다. 여러 소스로부터 클러스터를 동기화할 수 있으므로, 클러스터별로 여러 패키지를 사용할 수 있습니다.

구성 상태 섹션에는 다음 정보가 표시됩니다.

  • Fleet에 있는 총 패키지 수
  • Fleet에 있는 패키지의 동기화 상태

구성 개요 보기를 클릭하여 구성 동기화 대시보드를 봅니다. 클러스터에 구성 동기화를 설치하지 않았으면 구성 동기화 사용 설정을 클릭합니다.

구성 동기화에 대한 자세한 내용은 해당 문서를 참조하세요.

Fleet 효율성 보기

이 섹션에서는 Fleet별 리소스 사용률과 클러스터별 상위 및 하위 리소스 사용률을 포함하여 Fleet의 클라우드 또는 온프레미스 리소스 사용 현황을 자세히 보여줍니다. 예를 들어 잠재적으로 사용률이 낮거나 높을 때 크기를 조절할 수 있는 클러스터를 식별할 수 있습니다. Fleet 리소스 사용률 측정항목에서 이러한 측정항목이 계산되는 방식을 자세히 알아볼 수 있습니다.

시간 경과에 따른 리소스 사용률 보기

Fleet별 CPU/메모리/디스크 사용률 행에서는 시간별 Fleet 리소스 사용 방식을 자세히 확인할 수 있습니다. 또한 클러스터에서 요청된 리소스, 할당 가능한 리소스, 실제 사용량을 볼 수 있습니다. 각 패널에는 선택한 기간 동안 Fleet에서 집계된 CPU, 메모리 또는 디스크 사용량의 그래프가 표시되며 다음 정보가 별도의 줄로 표시됩니다.

  • 할당 가능: Fleet 클러스터 노드 간에 할당 가능한 리소스의 양입니다.
  • 요청됨: Fleet 전체에서 컨테이너가 요청한 리소스 양입니다.
  • 사용됨: 컨테이너에서 사용한 실제 리소스 양입니다.

그래프에서 특정 지점의 세부정보를 보려면 그래프에서 원하는 시간으로 스크롤합니다(예: 그래프에서 실제 사용량이 급증한 부분). 해당 시점의 할당 가능한 양 요청된 양, 실제 리소스 사용량 정보가 표시됩니다.

차트에서 하나 이상의 선 표시를 전환하려면 그래프 아래의 관련 측정항목을 클릭합니다.

클러스터별 상위 리소스 사용률 보기

다음 행에는 Fleet의 클러스터별 상위 CPU/메모리/디스크 사용률이 표시되며, 이를 통해 할당 가능한 리소스를 가장 많이 사용하는 특정 클러스터를 빠르게 확인할 수 있습니다. 각 패널에는 사용률 순으로 상위 5개 클러스터가 나열되며, 가장 높은 사용률이 첫 행에 표시됩니다. 각 클러스터에 대해 리소스 사용량 그래프와 선택한 기간 동안 할당 가능한 리소스 기준으로 평균 리소스 사용량을 확인할 수 있습니다. 예를 들어 이 뷰는 사용량이 과한 클러스터를 확인하는 데 도움이 됩니다. 사용 가능한 리소스가 부족한 클러스터는 포드를 예약하지 못할 수 있습니다.

클러스터의 리소스 사용에 대한 세부정보를 보려는 클러스터 이름을 클릭합니다. 또한 사용률 보기에서 컨테이너의 재시작 횟수와 클러스터에 포함된 오류 로그를 확인할 수 있습니다.

CPU/메모리/디스크 사용률별 모든 클러스터 보기를 클릭하여 Fleet에 있는 정렬된 모든 클러스터 목록을 확인합니다.

클러스터별 하위 리소스 사용률 보기

최종 리소스 사용률 행에는 Fleet의 클러스터별 하위 CPU/메모리/디스크 사용률이 표시되며, 이를 통해 사용률이 낮은 클러스터를 빠르게 확인할 수 있습니다. 각 패널의 상단에 리소스를 가장 적게 사용하는 5개 클러스터가 사용량 그래프와 함께 표시되고, 선택한 기간 동안 할당 가능한 리소스 기준으로 평균 리소스 사용량을 확인할 수 있습니다.

클러스터의 리소스 사용에 대한 세부정보를 보려는 클러스터 이름을 클릭합니다. 또한 사용률 보기에서 컨테이너의 재시작 횟수와 클러스터에 포함된 오류 로그를 확인할 수 있습니다.

CPU/메모리/디스크 사용률별 모든 클러스터 보기를 클릭하여 Fleet에 있는 정렬된 모든 클러스터 목록을 확인합니다.

팀 효율성 보기

이 섹션에서는 팀에서 클라우드 또는 온프레미스 리소스를 사용하는 방식에 대한 개요 보기를 제공합니다. 또한 문제가 발생한 팀을 모니터링하는 데에도 도움이 됩니다.

팀 대시보드에서 더 상세히 살펴보려는 팀을 클릭합니다. 팀 대시보드에서 리소스 사용률 및 팀의 네임스페이스에 대해 더 자세한 세부정보를 볼 수 있습니다. 그러면 팀의 리소스 사용량에 영향을 주는 네임스페이스를 확인할 수 있습니다.

팀 범위별 상위 리소스 사용률 보기

범위별 CPU/메모리/디스크 사용률을 통해 해당 리소스의 최대 사용자인 특정 팀을 빠르게 확인할 수 있습니다. 각 패널에는 사용률 순으로 상위 팀이 나열됩니다(내림차순). 각 팀에 대해 리소스 사용량 그래프와 요청을 기준으로 평균 리소스 사용량을 확인할 수 있습니다.

선택한 기간 동안 모든 팀의 리소스 사용률을 보려면 CPU/메모리/디스크 사용률별 모든 팀 보기를 클릭합니다.

범위별 오류 분포 보기

이 카드는 선택한 기간 동안 오류 로그가 가장 많은 팀을 나타냅니다.

오류 개수별로 정렬된 팀 목록을 보려면 오류 개수별 모든 범위 보기를 클릭합니다.

범위별 재시작 횟수 보기

이 섹션에서는 선택한 기간 동안 컨테이너 재시작 횟수가 가장 높은 팀을 보여줍니다.

재시작 횟수로 정렬된 팀 목록을 보려면 재시작 횟수별 모든 범위 보기를 클릭합니다.

Fleet 클러스터에 시스템 Cloud Monitoring 사용 설정

클러스터, 팀 범위, 총 리소스 사용률 보기 섹션에 언급된 것처럼 대시보드의 측정항목은 클러스터 구성요에 대한 Cloud Monitoring 데이터를 사용해서 생성됩니다(예: kube-systemgke-connect 네임스페이스의 워크로드). 따라서 Fleet 구성원 클러스터의 모든 시스템, 제어 영역, Kubernetes 상태 측정항목 구성요소에 대해 Cloud Monitoring을 사용 설정해야 합니다.

대부분의 GKE 및 GKE Enterprise 클러스터에는 기본적으로 Cloud Logging 및 Cloud Monitoring이 사용 설정되지만 모든 클러스터 구성요소에 대해 Cloud Monitoring을 여전히 수동으로 사용 설정해야 합니다. 연결된 클러스터의 경우 항상 Cloud Monitoring을 수동으로 설정해야 합니다.

Fleet에서 Cloud Monitoring이 사용 설정되지 않은 클러스터 구성요소가 1개라도 있는 경우에는 페이지 상단에 데이터가 누락된 클러스터 수가 표시됩니다.

이러한 클러스터에서 구성요소에 대해 Cloud Monitoring을 사용 설정하려면 클러스터 유형에 대한 다음 가이드를 참조하세요.

프로젝트 간 등록 클러스터의 모니터링 사용 설정

여러 Google Cloud 프로젝트에서 측정항목을 수집하고 확인하기 위해 Cloud Monitoring에서 다중 프로젝트 측정항목 범위를 만들 수 있습니다. 다른 프로젝트의 GKE 클러스터를 Fleet 호스트 프로젝트에 등록하면 두 프로젝트를 모두 포함하는 새 측정항목 범위가 자동으로 생성됩니다(아직 없는 경우). 개요에서 클러스터의 사용률 데이터를 확인할 수 있습니다.

다음 단계