Nesta página, mostramos como aumentar a largura de banda de rede para nós de GPU em clusters do Google Kubernetes Engine (GKE) usando a NIC virtual do Google (gVNIC).
Nos clusters do Autopilot, os nós que executam o GKE 1.30.2-gke.1023000 e versões mais recentes são fornecidos automaticamente com a placa de rede virtual do Google (gVNIC) instalada. As instruções nesta página se aplicam apenas aos clusters Standard.
Antes de começar
Antes de começar, verifique se você realizou as tarefas a seguir:
- Ativar a API Google Kubernetes Engine. Ativar a API Google Kubernetes Engine
- Se você quiser usar a Google Cloud CLI para essa tarefa,
instale e, em seguida,
inicialize a
CLI gcloud. Se você instalou a CLI gcloud anteriormente, instale a versão
mais recente executando
gcloud components update
.
Limitações
- Limitações do Compute Engine.
- A API gVNIC só é compatível com nós de GPU. Para aumentar a largura de banda nos nós que não são de GPU, considere ativar a largura de banda de nível 1.
Requisitos
- Os nós do GKE precisam usar uma imagem de nó do Container-Optimized OS.
Ativar gVNIC
É possível criar um cluster contendo pools de nós que usam gVNIC, criar um pool de nós com gVNIC ativada ou atualizar um pool de nós para usar gVNIC.
Criar um cluster
Crie um cluster contendo pools de nós que usam gVNIC:
gcloud container clusters create CLUSTER_NAME \
--accelerator type=GPU_TYPE,count=AMOUNT \
--machine-type=MACHINE_TYPE \
--enable-gvnic
Substitua:
CLUSTER_NAME
: o nome do novo cluster;GPU_TYPE
: o tipo de acelerador de GPU que você usa. Por exemplo,nvidia-tesla-t4
.AMOUNT
: o número de GPUs que serão anexadas aos nós do pool;MACHINE_TYPE
: o tipo de máquina que você quer usar. gVNIC não é compatível com tipos de máquinas com otimização de memória.
Criar um pool de nós
Crie um pool de nós que use gVNIC:
gcloud container node-pools create NODEPOOL_NAME \
--cluster=CLUSTER_NAME \
--enable-gvnic
Substitua:
NODEPOOL_NAME
: o nome de um novo pool de nós.CLUSTER_NAME
: o nome do cluster existente.
Atualizar um pool de nós
Atualize um pool de nós para usar gVNIC:
gcloud container node-pools update NODEPOOL_NAME \
--cluster=CLUSTER_NAME \
--enable-gvnic
Substitua:
NODEPOOL_NAME
: o nome do pool de nós que você quer atualizar.CLUSTER_NAME
: o nome do cluster existente.
Desativar gVNIC
Atualize o pool de nós usando a sinalização --no-enable-gvnic
:
gcloud container node-pools update NODEPOOL_NAME \
--cluster=CLUSTER_NAME \
--no-enable-gvnic
Solução de problemas
Para resolver problemas do gVNIC, consulte Solução de problemas do NIC virtual do Google.
A seguir
- Use a geração de registros de política de rede para gravar quando as conexões com pods são permitidas ou negadas pelas políticas de rede do cluster.