GPU 노드의 네트워크 트래픽 속도 향상


이 페이지에서는 Google 가상 NIC(gVNIC)를 사용하여 Google Kubernetes Engine(GKE) 클러스터에서 GPU 노드의 네트워크 대역폭을 늘리는 방법을 보여줍니다.

Autopilot 클러스터에서 GKE 버전 1.30.2-gke.1023000 이상을 실행하는 노드에는 Google Virtual NIC(gVNIC)가 자동으로 설치됩니다. 이 페이지의 안내는 Standard 클러스터에만 적용됩니다.

시작하기 전에

시작하기 전에 다음 태스크를 수행했는지 확인합니다.

  • Google Kubernetes Engine API를 사용 설정합니다.
  • Google Kubernetes Engine API 사용 설정
  • 이 태스크에 Google Cloud CLI를 사용하려면 gcloud CLI를 설치한 후 초기화합니다. 이전에 gcloud CLI를 설치한 경우 gcloud components update를 실행하여 최신 버전을 가져옵니다.

제한사항

  • Compute Engine 제한사항이 적용됩니다.
  • gVNIC API는 GPU 노드에서만 지원됩니다. 비GPU 노드의 대역폭을 늘리려면 Tier-1 대역폭을 사용 설정하는 것을 고려하세요.

요구사항

  • GKE 노드는 Container-Optimized OS 노드 이미지를 사용해야 합니다.

gVNIC 사용 설정

gVNIC를 사용하는 노드 풀이 있는 클러스터를 만들거나 gVNIC가 사용 설정된 노드 풀을 만들거나 gVNIC를 사용하도록 노드 풀을 업데이트할 수 있습니다.

클러스터 만들기

gVNIC를 사용하는 노드 풀을 사용하여 클러스터를 만듭니다.

gcloud container clusters create CLUSTER_NAME \
    --accelerator type=GPU_TYPE,count=AMOUNT \
    --machine-type=MACHINE_TYPE \
    --enable-gvnic

다음을 바꿉니다.

  • CLUSTER_NAME: 새 클러스터의 이름입니다.
  • GPU_TYPE: 사용하는 GPU 가속기의 유형입니다. 예를 들면 nvidia-tesla-t4입니다.
  • AMOUNT: 노드 풀의 노드에 연결할 GPU 수입니다.
  • MACHINE_TYPE: 사용할 머신 유형. gVNIC는 메모리 최적화 머신 유형에서 지원되지 않습니다.

노드 풀 만들기

gVNIC를 사용하는 노드 풀을 만듭니다.

gcloud container node-pools create NODEPOOL_NAME \
    --cluster=CLUSTER_NAME \
    --enable-gvnic

다음을 바꿉니다.

  • NODEPOOL_NAME: 새 노드 풀의 이름입니다.
  • CLUSTER_NAME: 기존 클러스터의 이름입니다.

노드 풀 업데이트

gVNIC를 사용하도록 노드 풀을 업데이트합니다.

gcloud container node-pools update NODEPOOL_NAME \
    --cluster=CLUSTER_NAME \
    --enable-gvnic

다음을 바꿉니다.

  • NODEPOOL_NAME: 업데이트하려는 노드 풀의 이름입니다.
  • CLUSTER_NAME: 기존 클러스터의 이름입니다.

gVNIC 중지

--no-enable-gvnic 플래그를 사용하여 노드 풀을 업데이트합니다.

gcloud container node-pools update NODEPOOL_NAME \
    --cluster=CLUSTER_NAME \
    --no-enable-gvnic

문제 해결

gVNIC 문제를 해결하려면 Google Virtual NIC 문제 해결을 참조하세요.

다음 단계