이 페이지에서는 Google 가상 NIC(gVNIC)를 사용하여 Google Kubernetes Engine(GKE) 클러스터에서 GPU 노드의 네트워크 대역폭을 늘리는 방법을 보여줍니다.
Autopilot 클러스터에서 GKE 버전 1.30.2-gke.1023000 이상을 실행하는 노드에는 Google Virtual NIC(gVNIC)가 자동으로 설치됩니다. 이 페이지의 안내는 Standard 클러스터에만 적용됩니다.
시작하기 전에
시작하기 전에 다음 태스크를 수행했는지 확인합니다.
- Google Kubernetes Engine API를 사용 설정합니다. Google Kubernetes Engine API 사용 설정
- 이 태스크에 Google Cloud CLI를 사용하려면 gcloud CLI를 설치한 후 초기화합니다. 이전에 gcloud CLI를 설치한 경우
gcloud components update
를 실행하여 최신 버전을 가져옵니다.
제한사항
- Compute Engine 제한사항이 적용됩니다.
- gVNIC API는 GPU 노드에서만 지원됩니다. 비GPU 노드의 대역폭을 늘리려면 Tier-1 대역폭을 사용 설정하는 것을 고려하세요.
요구사항
- GKE 노드는 Container-Optimized OS 노드 이미지를 사용해야 합니다.
gVNIC 사용 설정
gVNIC를 사용하는 노드 풀이 있는 클러스터를 만들거나 gVNIC가 사용 설정된 노드 풀을 만들거나 gVNIC를 사용하도록 노드 풀을 업데이트할 수 있습니다.
클러스터 만들기
gVNIC를 사용하는 노드 풀을 사용하여 클러스터를 만듭니다.
gcloud container clusters create CLUSTER_NAME \
--accelerator type=GPU_TYPE,count=AMOUNT \
--machine-type=MACHINE_TYPE \
--enable-gvnic
다음을 바꿉니다.
CLUSTER_NAME
: 새 클러스터의 이름입니다.GPU_TYPE
: 사용하는 GPU 가속기의 유형입니다. 예를 들면nvidia-tesla-t4
입니다.AMOUNT
: 노드 풀의 노드에 연결할 GPU 수입니다.MACHINE_TYPE
: 사용할 머신 유형. gVNIC는 메모리 최적화 머신 유형에서 지원되지 않습니다.
노드 풀 만들기
gVNIC를 사용하는 노드 풀을 만듭니다.
gcloud container node-pools create NODEPOOL_NAME \
--cluster=CLUSTER_NAME \
--enable-gvnic
다음을 바꿉니다.
NODEPOOL_NAME
: 새 노드 풀의 이름입니다.CLUSTER_NAME
: 기존 클러스터의 이름입니다.
노드 풀 업데이트
gVNIC를 사용하도록 노드 풀을 업데이트합니다.
gcloud container node-pools update NODEPOOL_NAME \
--cluster=CLUSTER_NAME \
--enable-gvnic
다음을 바꿉니다.
NODEPOOL_NAME
: 업데이트하려는 노드 풀의 이름입니다.CLUSTER_NAME
: 기존 클러스터의 이름입니다.
gVNIC 중지
--no-enable-gvnic
플래그를 사용하여 노드 풀을 업데이트합니다.
gcloud container node-pools update NODEPOOL_NAME \
--cluster=CLUSTER_NAME \
--no-enable-gvnic
문제 해결
gVNIC 문제를 해결하려면 Google Virtual NIC 문제 해결을 참조하세요.
다음 단계
- 네트워크 정책 로깅을 사용하여 클러스터의 네트워크 정책에 따라 pod 연결이 허용되거나 거부되는 시점을 기록합니다.