이 페이지에서는 빠른 시작 노드를 사용하여 Google Kubernetes Engine (GKE) 클러스터에서 워크로드를 더 빠르게 배포하고 확장하는 방법을 보여줍니다. 워크로드에서 호환되는 구성을 사용하는 경우 최선을 다하는 방식으로 Autopilot 모드가 사용 설정된 GKE에서 빠른 시작 노드가 사용됩니다.
빠르게 시작하는 GKE 노드는 호환되는 머신 계열의 시작 시간이 훨씬 짧습니다. 시작 시간이 단축되면 다음과 같은 이점이 있습니다.
- 콜드 스타트 속도 향상
- 빠른 자동 확장
- 포드 예약 롱테일 지연 시간 개선
- 인프라 비용 효율성 개선
빠르게 시작하는 노드를 사용하면 GKE가 하드웨어 리소스를 사전 초기화하여 시작 시간을 단축합니다. 사전 초기화된 리소스는 최선을 다해 제공됩니다. 서지 요청은 부분적으로만 처리될 수 있습니다. 빠르게 시작하는 노드가 없으면 리소스가 주문형으로 초기화되고 노드가 정상 시작 시간에 제공됩니다.
요구사항
빠르게 시작하는 노드에는 추가 구성이 필요하지 않습니다. 워크로드에서 호환되는 구성을 사용하는 경우 GKE는 빠른 시작 노드를 자동으로 사용합니다. 빠르게 시작하는 노드를 사용하려면 다음 요구사항을 모두 충족해야 합니다.
- Autopilot 클러스터를 사용합니다.
- 신속 출시 채널에서 버전을 사용합니다.
다음 호환 컴퓨팅 리소스를 사용하세요. 호환되는 최대 부팅 디스크 크기는 500GiB입니다.
- NVIDIA L4 GPU (G2 머신 시리즈)
pd-balanced
부팅 디스크 유형을 사용합니다.빠르게 시작하는 노드와 호환되지 않는 기능은 사용하지 마세요. 자세한 내용은 제한사항을 참고하세요.
제한사항
다음 기능은 빠른 시작 GKE 노드와 호환되지 않습니다. 이러한 기능을 사용하는 경우 GKE는 일반적인 시작 시간으로 노드를 프로비저닝합니다.
Autopilot GPU 워크로드
Autopilot 클러스터에서 호환되는 GPU를 요청하면 Autopilot GPU 워크로드가 빠르게 시작하는 노드를 사용할 수 있으므로 GKE Standard 클러스터에서 유사한 요청을 하는 경우보다 노드 시작 시간이 최대 4배, 포드 예약 시간이 최대 2배 빨라집니다.
다음은 몇 가지 사용 사례입니다. 하지만 요구사항 섹션의 조건을 충족하는 포드는 빠른 시작 노드와 호환됩니다.
ComputeClass
다음 예와 같이 ComputeClass에서 호환되는 가속기 유형과 수를 요청합니다.
apiVersion: cloud.google.com/v1
kind: ComputeClass
metadata:
name: ACCELERATOR_COMPUTE_CLASS_NAME
spec:
priorities:
- gpu:
type: ACCELERATOR_TYPE
count: ACCELERATOR_COUNT
nodePoolAutoCreation:
enabled: true
다음 예와 같이 포드에서 이 ComputeClass를 선택하면 GKE는 빠른 시작 노드를 사용합니다.
apiVersion: v1
kind: Pod
metadata:
name: POD_NAME
spec:
nodeSelector:
# Select a ComputeClass that requests compatible GPUs
cloud.google.com/compute-class: ACCELERATOR_COMPUTE_CLASS_NAME
containers:
- name: my-container
image: gcr.io/google_containers/pause
resources:
limits:
nvidia.com/gpu: ACCELERATOR_COUNT
다음 값을 바꿉니다.
ACCELERATOR_COMPUTE_CLASS_NAME
: 가속기를 요청하는 ComputeClass의 이름입니다.ACCELERATOR_TYPE
: 가속기 유형입니다.ACCELERATOR_COUNT
: 포드에 필요한 가속기 수입니다. 이 값은 ComputeClass의spec.priorities.gpu.count
필드 값보다 작거나 같아야 합니다.POD_NAME
: 포드의 이름입니다.
ComputeClass에 관한 자세한 내용은 커스텀 컴퓨팅 클래스 정보를 참고하세요.
포드 사양
다음 예와 같이 포드 사양에서 호환되는 가속기 유형과 수를 선택합니다.
apiVersion: v1
kind: Pod
metadata:
name: POD_NAME
spec:
nodeSelector:
cloud.google.com/gke-accelerator: ACCELERATOR_NAME
containers:
- name: my-container
image: gcr.io/google_containers/pause
resources:
limits:
nvidia.com/gpu: ACCELERATOR_COUNT
다음 값을 바꿉니다.
POD_NAME
: 포드의 이름입니다.ACCELERATOR_NAME
: 포드에 필요한 액셀러레이터의 이름입니다.ACCELERATOR_COUNT
: 포드에 필요한 가속기 수입니다.
가격 책정
빠르게 시작하는 노드는 GKE Autopilot에서 추가 비용 없이 사용할 수 있습니다. GKE Autopilot 가격 책정에 대한 자세한 내용은 Google Kubernetes Engine 가격 책정의 Autopilot 모드 섹션을 참고하세요.