Aumentar a velocidade do tráfego de rede para nós da GPU


Nesta página, mostramos como aumentar a largura de banda de rede para nós de GPU em clusters do Google Kubernetes Engine (GKE) usando a NIC virtual do Google (gVNIC).

Antes de começar

Antes de começar, verifique se você realizou as tarefas a seguir:

  • Ativar a API Google Kubernetes Engine.
  • Ativar a API Google Kubernetes Engine
  • Se você quiser usar a Google Cloud CLI para essa tarefa, instale e, em seguida, inicialize a CLI gcloud. Se você instalou a CLI gcloud anteriormente, instale a versão mais recente executando gcloud components update.

Limitações

Requisitos

  • Os nós do GKE precisam usar uma imagem de nó do Container-Optimized OS.

Ativar gVNIC

É possível criar um cluster contendo pools de nós que usam gVNIC, criar um pool de nós com gVNIC ativada ou atualizar um pool de nós para usar gVNIC.

Criar um cluster

Crie um cluster contendo pools de nós que usam gVNIC:

gcloud container clusters create CLUSTER_NAME \
    --accelerator type=GPU_TYPE,count=AMOUNT \
    --machine-type=MACHINE_TYPE \
    --enable-gvnic

Substitua:

  • CLUSTER_NAME: o nome do novo cluster;
  • GPU_TYPE: o tipo de GPU. Será um dos seguintes valores:
    • nvidia-tesla-k80
    • nvidia-tesla-p100
    • nvidia-tesla-p4
    • nvidia-tesla-v100
    • nvidia-tesla-t4
    • nvidia-tesla-a100
    • nvidia-a100-80gb
    • nvidia-l4
  • AMOUNT: o número de GPUs que serão anexadas aos nós do pool;
  • MACHINE_TYPE: o tipo de máquina que você quer usar. gVNIC não é compatível com tipos de máquinas com otimização de memória.

Criar um pool de nós

Crie um pool de nós que use gVNIC:

gcloud container node-pools create NODEPOOL_NAME \
    --cluster=CLUSTER_NAME \
    --enable-gvnic

Substitua:

  • NODEPOOL_NAME: o nome de um novo pool de nós.
  • CLUSTER_NAME: o nome do cluster existente.

Atualizar um pool de nós

Atualize um pool de nós para usar gVNIC:

gcloud container node-pools update NODEPOOL_NAME \
    --cluster=CLUSTER_NAME \
    --enable-gvnic

Substitua:

  • NODEPOOL_NAME: o nome do pool de nós que você quer atualizar.
  • CLUSTER_NAME: o nome do cluster existente.

Desativar gVNIC

Atualize o pool de nós usando a sinalização --no-enable-gvnic:

gcloud container node-pools update NODEPOOL_NAME \
    --cluster=CLUSTER_NAME \
    --no-enable-gvnic

Solução de problemas

Para resolver problemas do gVNIC, consulte Solução de problemas do NIC virtual do Google.

A seguir