수직형 pod 자동 확장

이 페이지에서는 수직형 pod 자동 확장을 간략하게 설명하며 VerticalPodAutoscaler 커스텀 리소스 및 관련 유형의 참조 자료를 제공합니다.

또한 수직형 pod 자동 확장을 구성하는 방법도 알아볼 수 있습니다.

수직형 pod 자동 확장은 기본적으로 Autopilot 클러스터에서 사용 설정됩니다. 그러나 수직형 pod 자동 확장 구성의 설명대로 VerticalPodAutoscaler 객체를 만들어 워크로드의 수직형 pod 자동 확장 처리를 구성해야 합니다.

개요

수직형 pod 자동 확장을 사용하면 컨테이너의 CPU 요청 및 한도메모리 요청 및 한도에 어떤 값을 지정해야 할지를 고민하지 않아도 됩니다. 자동 확장 처리는 CPU 및 메모리 요청과 한도의 값을 추천하거나 값을 자동으로 업데이트할 수 있습니다.

수직형 pod 자동 확장은 다음과 같은 이점을 제공합니다.

  • pod가 필요한 만큼만 사용하기 때문에 클러스터 노드가 효율적으로 사용됩니다.

  • 사용할 수 있는 적절한 리소스가 있는 노드에 pod가 예약됩니다.

  • CPU 및 메모리 요청의 정확한 값을 알아내기 위해 런타임을 소비하는 벤치마크 테스트를 실행할 필요가 없습니다.

  • 시간이 지나면서 자동 확장 처리가 사용자 개입 없이 CPU 및 메모리 요청을 조정할 수 있기 때문에 유지보수 시간이 단축됩니다.

Google Kubernetes Engine(GKE) 수직형 pod 자동 확장은 Kubernetes 오픈소스 자동 확장 처리보다 다음과 같은 이점을 제공합니다.

  • 추천 대상을 결정할 때 최대 노드 크기 및 리소스 할당량을 고려합니다.

  • 클러스터 용량을 조정하도록 클러스터 자동 확장 처리에 알립니다.

  • 이전 데이터를 사용하여 수직형 pod 자동 확장 처리가 사용 설정되기 전에 수집된 측정항목을 제공합니다.

  • 워커 노드에 배포하는 대신 수직형 pod 자동 확장 처리 pod를 제어 영역 프로세스로 실행합니다.

수직형 pod 자동 확장의 제한사항

  • 수직형 pod 자동 확장은 클러스터당 최대 500개의 VerticalPodAutoscaler 객체를 지원합니다.

  • 수직형 pod 자동 확장은 버전 1.12.6부터 리전 클러스터에서 지원됩니다.

  • 수평형 pod 자동 확장과 함께 수직형 pod 자동 확장을 사용하려면 다차원 pod 자동 확장을 사용합니다. 커스텀 측정항목과 외부 측정항목에서 수평형 pod 자동 확장과 함께 수직형 pod 자동 확장을 사용할 수도 있습니다.

  • 워크로드의 실제 메모리 사용량에 대한 제한된 공개 상태로 인해 수직형 pod 자동 확장 처리를 아직 JVM 기반 워크로드에서 사용할 수 없습니다.

  • 수직형 pod 자동 확장은 주입된 사이드카에 대한 권장사항을 자동으로 적용할 수 없습니다. "Off" 이외의 updateMode로 주입된 사이드카를 사용하여 pod의 VerticalPodAutoscaler 객체를 만드는 경우 컨테이너 리소스 정책을 사용하여 이 사이드카를 선택 해제해야 합니다. 참조 섹션의 ContainerResourcePolicy특정 컨테이너를 선택 해제하는 방법을 참조하세요.

    알려진 문제 중 하나는 Istio와 함께 수직형 pod 자동 확장을 사용하는 것입니다. 이 제한은 Istio 사이드카에 영향을 미칩니다. 이 문제를 해결하려면 다음과 같이 VerticalPodAutoscaler 사양 정의를 확장하여 Istio 사이드카를 선택 해제합니다.

    resourcePolicy:
      containerPolicies:
      - containerName: istio-proxy
        mode: "Off"
    

자동 모드의 수직형 pod 자동 확장

Kubernetes 제한사항에 따라 실행 중인 pod의 리소스 요청을 수정하는 유일한 방법은 pod를 다시 만드는 것입니다. updateMode"Auto"VerticalPodAutoscaler를 만들면 VerticalPodAutoscaler는 pod의 리소스 요청을 변경해야 하는 경우 pod를 삭제합니다.

pod 재시작 수를 제한하려면 pod 중단 예산을 사용합니다.

클러스터가 새로운 크기의 워크로드를 처리할 수 있도록 클러스터 자동 확장 처리노드 자동 프로비저닝을 사용합니다. 수직형 pod 자동 확장은 업데이트 전에 클러스터 자동 확장 처리에 업데이트를 알리며 다시 생성하기 전에 크기가 조절된 워크로드에 필요한 리소스를 제공하여 중단 시간을 최소화합니다.

참조

VerticalPodAutoscaler v1 autoscaling.k8s.io

필드

TypeMeta

API 그룹, 버전, 종류

metadata

ObjectMeta

표준 객체 메타데이터

spec

VerticalPodAutoscalerSpec

원하는 VerticalPodAutoscaler의 동작

status

VerticalPodAutoscalerStatus

가장 최근에 관찰된 VerticalPodAutoscaler 상태

VerticalPodAutoscalerSpec v1 autoscaling.k8s.io

필드
targetRef

CrossVersionObjectReference

자동 확장 처리가 제어할 pod 집합을 관리하는 컨트롤러를 가리킵니다(예: 배포 또는 StatefulSet). 확장 하위 리소스가 있는 컨트롤러의 VerticalPodAutoscaler를 가리킬 수 있습니다. 일반적으로 VerticalPodAutoscaler는 컨트롤러의 ScaleStatus에서 pod 집합을 검색합니다. 일부 잘 알려진 컨트롤러(예: DaemonSet)의 경우, VerticalPodAutoscaler는 컨트롤러 사양에서 pod 집합을 검색합니다.

updatePolicy

PodUpdatePolicy

pod가 시작될 때 추천 업데이트가 적용되는지 여부와 pod의 수명 동안 추천 업데이트가 적용되는지 여부를 지정합니다.

resourcePolicy

PodResourcePolicy

개별 컨테이너의 CPU 및 메모리 요청을 조정하는 방법에 대한 정책을 지정합니다. 리소스 정책을 사용하면 개별 컨테이너의 추천에 제약조건을 설정할 수 있습니다. 지정되지 않은 경우 자동 확장 처리는 추가 제약 없이 pod의 모든 컨테이너에 대한 추천 리소스를 계산합니다.

VerticalPodAutoscalerList v1 autoscaling.k8s.io

필드

TypeMeta

API 그룹, 버전, 종류

metadata

ObjectMeta

표준 객체 메타데이터

items

VerticalPodAutoscaler array

VerticalPodAutoscaler 객체 목록

PodUpdatePolicy v1 autoscaling.k8s.io

필드
updateMode

string

pod가 시작될 때 추천 업데이트가 적용되는지 여부와 pod의 수명 동안 추천 업데이트가 적용되는지 여부를 지정합니다. 가능한 값은 'Off', 'Initial', 'Recreate', 'Auto'입니다.

PodResourcePolicy v1 autoscaling.k8s.io

필드
containerPolicies

ContainerResourcePolicy array

개별 컨테이너의 리소스 정책 배열 이름이 지정된 컨테이너마다 최대 한 개의 항목이 포함될 수 있으며, 개별 정책이 없는 모든 컨테이너를 처리하는 `containerName = '*'`가 있는 단일 와일드 카드 항목이 선택적으로 있을 수 있습니다.

ContainerResourcePolicy v1 autoscaling.k8s.io

필드
containerName

string

정책이 적용될 컨테이너의 이름입니다. 지정하지 않으면 기본 정책으로 사용됩니다.

mode

ContainerScalingMode

컨테이너가 시작될 때 추천 업데이트가 적용되는지 여부와 컨테이너의 수명 동안 추천 업데이트가 적용되는지 여부를 지정합니다. 가능한 값은 'Off'와 'Auto'입니다.

minAllowed

ResourceList

컨테이너에 허용되는 최소 CPU 요청 및 메모리 요청을 지정합니다.

maxAllowed

ResourceList

컨테이너에 허용되는 최대 CPU 요청 및 메모리 요청을 지정합니다.

ControlledResources

[]ResourceName

VerticalPodAutoscaler에서 계산하고 적용할 권장사항 유형을 지정합니다. 비워 두면 기본값 [ResourceCPU, ResourceMemory]가 사용됩니다.

VerticalPodAutoscalerStatus v1 autoscaling.k8s.io

필드
recommendation

RecommendedPodResources

최근에 추천된 CPU 및 메모리 요청입니다.

conditions

VerticalPodAutoscalerCondition array

VerticalPodAutoscaler의 현재 상태를 설명합니다.

RecommendedPodResources v1 autoscaling.k8s.io

필드
containerRecommendation

RecommendedContainerResources array

개별 컨테이너의 리소스 추천 배열

RecommendedContainerResources v1 autoscaling.k8s.io

필드
containerName

string

추천이 적용되는 컨테이너의 이름

target

ResourceList

컨테이너에 추천되는 CPU 요청 및 메모리 요청

lowerBound

ResourceList

컨테이너에 추천되는 최소 CPU 요청 및 메모리 요청. 이 양은 애플리케이션을 안정적으로 실행하는 데 충분하다는 것을 보장하지 않습니다. 더 적은 CPU 및 메모리 요청으로 실행하면 성능이나 가용성에 상당한 영향을 미칠 가능성이 높습니다.

upperBound

ResourceList

컨테이너에 추천되는 최대 CPU 요청 및 메모리 요청. 이 값보다 높은 CPU 및 메모리 요청은 낭비될 가능성이 높습니다.

uncappedTarget

ResourceList

자동 확장 처리에서 계산한 최근의 리소스 추천으로, ContainerResourcePolicy를 고려하지 않고 실제 리소스 사용량을 기준으로 계산한 것입니다. 실제 리소스 사용량으로 인해 대상이 ContainerResourcePolicy를 위반하게 되는 경우 제한된 추천과 다를 수 있습니다. 이 필드는 실제 리소스 할당에는 영향을 미치지 않습니다. 상태 표시 용도로만 사용됩니다.

VerticalPodAutoscalerCondition v1 autoscaling.k8s.io

필드
type

VerticalPodAutoscalerConditionType

설명하고 있는 조건의 유형. 가능한 값은 'RecommendationProvided', 'LowConfidence', 'NoPodsMatched', 'FetchingHistory'입니다.

status

ConditionStatus

조건의 상태. 가능한 값은 True, False, Unknown입니다.

lastTransitionTime

Time

조건이 한 상태에서 다른 상태로 전환된 마지막 시간

reason

string

마지막 상태 전환의 이유

message

string

사람이 읽을 수 있으며 마지막 상태 전환의 세부정보를 제공하는 문자열

다음 단계