Questa pagina mostra come aumentare la larghezza di banda della rete per i nodi GPU sui cluster Google Kubernetes Engine (GKE) utilizzando il NIC virtuale di Google (gVNIC).
Prima di iniziare
Prima di iniziare, assicurati di aver eseguito le seguenti attività:
- Abilita l'API Google Kubernetes Engine. Abilita l'API Google Kubernetes Engine
- Se vuoi utilizzare Google Cloud CLI per questa attività, installa e initialize gcloud CLI. Se hai già installato gcloud CLI, scarica la versione più recente eseguendo
gcloud components update
.
Limitazioni
- Si applicano limitazioni di Compute Engine.
- L'API gVNIC è supportata solo sui nodi GPU. Per aumentare la larghezza di banda sui nodi non GPU, ti consigliamo di abilitare la larghezza di banda di livello 1.
Requisiti
- I nodi GKE devono utilizzare un'immagine del nodo Container-Optimized OS.
Attiva gVNIC
Puoi creare un cluster con pool di nodi che utilizzano gVNIC, creare un pool di nodi con gVNIC abilitato o aggiornare un pool di nodi per utilizzare gVNIC.
crea un cluster
Crea un cluster con pool di nodi che utilizzano gVNIC:
gcloud container clusters create CLUSTER_NAME \
--accelerator type=GPU_TYPE,count=AMOUNT \
--machine-type=MACHINE_TYPE \
--enable-gvnic
Sostituisci quanto segue:
CLUSTER_NAME
: il nome del nuovo cluster.GPU_TYPE
: il tipo di GPU. Può essere uno dei seguenti:nvidia-tesla-k80
nvidia-tesla-p100
nvidia-tesla-p4
nvidia-tesla-v100
nvidia-tesla-t4
nvidia-tesla-a100
nvidia-a100-80gb
nvidia-l4
AMOUNT
: il numero di GPU da collegare ai nodi nel pool di nodi.MACHINE_TYPE
: il tipo di macchina che desideri utilizzare. gVNIC non è supportato sui tipi di macchina ottimizzati per la memoria.
Crea un pool di nodi
Crea un pool di nodi che utilizza gVNIC:
gcloud container node-pools create NODEPOOL_NAME \
--cluster=CLUSTER_NAME \
--enable-gvnic
Sostituisci quanto segue:
NODEPOOL_NAME
: il nome di un nuovo pool di nodi.CLUSTER_NAME
: il nome del cluster esistente.
Aggiornamento di un pool di nodi
Aggiorna un pool di nodi per utilizzare gVNIC:
gcloud container node-pools update NODEPOOL_NAME \
--cluster=CLUSTER_NAME \
--enable-gvnic
Sostituisci quanto segue:
NODEPOOL_NAME
: il nome del pool di nodi che vuoi aggiornare.CLUSTER_NAME
: il nome del cluster esistente.
Disattiva gVNIC
Aggiorna il pool di nodi utilizzando il flag --no-enable-gvnic
:
gcloud container node-pools update NODEPOOL_NAME \
--cluster=CLUSTER_NAME \
--no-enable-gvnic
Risoluzione dei problemi
Per risolvere i problemi relativi a gVNIC, consulta la sezione Risoluzione dei problemi relativi ai NIC virtuali di Google.
Passaggi successivi
- Usa il logging dei criteri di rete per registrare quando le connessioni ai pod vengono consentite o negate dai criteri di rete del cluster.