Aumenta la velocità del traffico di rete per i nodi GPU


Questa pagina mostra come aumentare la larghezza di banda della rete per i nodi GPU nei cluster Google Kubernetes Engine (GKE) utilizzando il NIC virtuale (gVNIC) di Google.

Prima di iniziare

Prima di iniziare, assicurati di aver eseguito le seguenti attività:

  • Abilita l'API Google Kubernetes Engine.
  • Abilita l'API Google Kubernetes Engine
  • Se vuoi utilizzare Google Cloud CLI per questa attività, installa e initialize gcloud CLI. Se hai già installato gcloud CLI, scarica la versione più recente eseguendo gcloud components update.

Limitazioni

Requisiti

  • I nodi GKE devono utilizzare un'immagine nodo del sistema operativo ottimizzato per i container.

Attiva gVNIC

Puoi creare un cluster con pool di nodi che utilizzano gVNIC, creare un pool di nodi con gVNIC abilitato o aggiornare un pool di nodi per utilizzare gVNIC.

Crea un cluster

Crea un cluster con pool di nodi che utilizzano gVNIC:

gcloud container clusters create CLUSTER_NAME \
    --accelerator type=GPU_TYPE,count=AMOUNT \
    --machine-type=MACHINE_TYPE \
    --enable-gvnic

Sostituisci quanto segue:

  • CLUSTER_NAME: il nome del nuovo cluster.
  • GPU_TYPE: il tipo di acceleratore GPU utilizzato. Ad esempio: nvidia-tesla-t4.
  • AMOUNT: il numero di GPU da collegare ai nodi nel pool di nodi.
  • MACHINE_TYPE: il tipo di macchina che vuoi utilizzare. gVNIC non è supportato per i tipi di macchine ottimizzate per la memoria.

Crea un pool di nodi

Crea un pool di nodi che utilizza gVNIC:

gcloud container node-pools create NODEPOOL_NAME \
    --cluster=CLUSTER_NAME \
    --enable-gvnic

Sostituisci quanto segue:

  • NODEPOOL_NAME: il nome di un nuovo pool di nodi.
  • CLUSTER_NAME: il nome del cluster esistente.

Aggiornamento di un pool di nodi

Aggiorna un pool di nodi per utilizzare gVNIC:

gcloud container node-pools update NODEPOOL_NAME \
    --cluster=CLUSTER_NAME \
    --enable-gvnic

Sostituisci quanto segue:

  • NODEPOOL_NAME: il nome del pool di nodi che vuoi aggiornare.
  • CLUSTER_NAME: il nome del cluster esistente.

Disattiva gVNIC

Aggiorna il pool di nodi utilizzando il flag --no-enable-gvnic:

gcloud container node-pools update NODEPOOL_NAME \
    --cluster=CLUSTER_NAME \
    --no-enable-gvnic

Risoluzione dei problemi

Per risolvere i problemi relativi a gVNIC, consulta Risoluzione dei problemi relativi al NIC virtuale di Google.

Passaggi successivi