Aumentare la velocità del traffico di rete per i nodi GPU


Questa pagina mostra come aumentare la larghezza di banda di rete per i nodi GPU nei cluster Google Kubernetes Engine (GKE) utilizzando la scheda di rete virtuale di Google (gVNIC).

Nei cluster Autopilot, i nodi che eseguono GKE versione 1.30.2-gke.1023000 e successive hanno la scheda di rete virtuale Google (gVNIC) installata automaticamente. Le istruzioni riportate in questa pagina si applicano solo ai cluster standard.

Per aumentare la larghezza di banda sui nodi CPU, valuta la possibilità di attivare la larghezza di banda di livello 1.

Prima di iniziare

Prima di iniziare, assicurati di aver eseguito le seguenti operazioni:

  • Attiva l'API Google Kubernetes Engine.
  • Attiva l'API Google Kubernetes Engine
  • Se vuoi utilizzare Google Cloud CLI per questa attività, installa e poi inizializza gcloud CLI. Se hai già installato gcloud CLI, ottieni la versione più recente eseguendo gcloud components update.

Limitazioni

Requisiti

Attiva gVNIC

Puoi creare un cluster con pool di nodi che utilizzano gVNIC, creare un pool di nodi con gVNIC abilitato o aggiornare un pool di nodi in modo che utilizzi gVNIC.

Crea un cluster

Crea un cluster con pool di nodi che utilizzano gVNIC:

gcloud container clusters create CLUSTER_NAME \
    --accelerator type=GPU_TYPE,count=AMOUNT \
    --machine-type=MACHINE_TYPE \
    --enable-gvnic

Sostituisci quanto segue:

  • CLUSTER_NAME: il nome del nuovo cluster.
  • GPU_TYPE: il tipo di acceleratore GPU che utilizzi. Ad esempio: nvidia-tesla-t4.
  • AMOUNT: il numero di GPU da collegare ai nodi nel pool di nodi.
  • MACHINE_TYPE: il tipo di macchina che vuoi utilizzare. La gVNIC non è supportata su tipi di macchine ottimizzate per la memoria.

Crea un node pool

Crea un pool di nodi che utilizza gVNIC:

gcloud container node-pools create NODEPOOL_NAME \
    --cluster=CLUSTER_NAME \
    --enable-gvnic

Sostituisci quanto segue:

  • NODEPOOL_NAME: il nome di un nuovo pool di nodi.
  • CLUSTER_NAME: il nome del cluster esistente.

Aggiornamento di un pool di nodi

Aggiorna un pool di nodi in modo che utilizzi gVNIC:

gcloud container node-pools update NODEPOOL_NAME \
    --cluster=CLUSTER_NAME \
    --enable-gvnic

Sostituisci quanto segue:

  • NODEPOOL_NAME: il nome del pool di nodi da aggiornare.
  • CLUSTER_NAME: il nome del cluster esistente.

Questa modifica richiede la ricreazione dei nodi, il che può causare interruzioni dei carichi di lavoro in esecuzione. Per informazioni dettagliate su questa modifica specifica, individua la riga corrispondente nella tabella Modifiche manuali che ricreano i nodi utilizzando una strategia di upgrade dei nodi senza rispettare i criteri di manutenzione. Per scoprire di più sugli aggiornamenti dei nodi, consulta Pianificare le interruzioni per gli aggiornamenti dei nodi.

Disattiva gVNIC

Aggiorna il pool di nodi utilizzando il flag --no-enable-gvnic:

gcloud container node-pools update NODEPOOL_NAME \
    --cluster=CLUSTER_NAME \
    --no-enable-gvnic

Questa modifica richiede la ricreazione dei nodi, il che può causare interruzioni dei carichi di lavoro in esecuzione. Per informazioni dettagliate su questa modifica specifica, individua la riga corrispondente nella tabella Modifiche manuali che ricreano i nodi utilizzando una strategia di upgrade dei nodi senza rispettare i criteri di manutenzione. Per scoprire di più sugli aggiornamenti dei nodi, consulta Pianificare le interruzioni per gli aggiornamenti dei nodi.

Risoluzione dei problemi

Per risolvere i problemi relativi a gVNIC, consulta Risoluzione dei problemi relativi a Google Virtual NIC.

Passaggi successivi