Augmenter la vitesse de trafic réseau pour les nœuds GPU


Cette page explique comment augmenter la bande passante réseau pour les nœuds GPU sur les clusters Google Kubernetes Engine (GKE) à l'aide de la carte d'interface réseau virtuelle Google (gVNIC).

Dans les clusters Autopilot, la carte d'interface réseau virtuelle Google (gVNIC) est installée automatiquement sur les nœuds qui exécutent GKE version 1.30.2-gke.1023000 ou une version ultérieure. Les instructions de cette page ne s'appliquent qu'aux clusters standards.

Avant de commencer

Avant de commencer, effectuez les tâches suivantes :

  • Activez l'API Google Kubernetes Engine.
  • Activer l'API Google Kubernetes Engine
  • Si vous souhaitez utiliser Google Cloud CLI pour cette tâche, installez puis initialisez gcloud CLI. Si vous avez déjà installé gcloud CLI, assurez-vous de disposer de la dernière version en exécutant la commande gcloud components update.

Limites

Conditions requises

  • Les nœuds GKE doivent utiliser une image de nœud Container-Optimized OS.

Activer gVNIC

Vous pouvez créer un cluster dans lequel des pools de nœuds utilisent gVNIC, créer un pool de nœuds avec gVNIC activé, ou mettre à jour un pool de nœuds pour utiliser gVNIC.

Créer un cluster

Créer un cluster avec des pools de nœuds utilisant gVNIC :

gcloud container clusters create CLUSTER_NAME \
    --accelerator type=GPU_TYPE,count=AMOUNT \
    --machine-type=MACHINE_TYPE \
    --enable-gvnic

Remplacez les éléments suivants :

  • CLUSTER_NAME : nom du nouveau cluster
  • GPU_TYPE : type d'accélérateur GPU que vous utilisez. Exemple :nvidia-tesla-t4
  • AMOUNT : nombre de GPU à associer aux nœuds du pool de nœuds.
  • MACHINE_TYPE : type de machine que vous souhaitez utiliser. gVNIC n'est pas compatible avec les types de machines à mémoire optimisée.

Créer un pool de nœuds

Créer un pool de nœuds utilisant gVNIC :

gcloud container node-pools create NODEPOOL_NAME \
    --cluster=CLUSTER_NAME \
    --enable-gvnic

Remplacez les éléments suivants :

  • NODEPOOL_NAME : nom du nouveau pool de nœuds.
  • CLUSTER_NAME : nom du cluster existant.

Mettre à jour un pool de nœuds

Mettre à jour un pool de nœuds pour utiliser gVNIC :

gcloud container node-pools update NODEPOOL_NAME \
    --cluster=CLUSTER_NAME \
    --enable-gvnic

Remplacez les éléments suivants :

  • NODEPOOL_NAME : nom du pool de nœuds que vous souhaitez mettre à jour.
  • CLUSTER_NAME : nom du cluster existant.

Désactiver gVNIC

Mettre à jour le pool de nœuds à l'aide de l'option --no-enable-gvnic :

gcloud container node-pools update NODEPOOL_NAME \
    --cluster=CLUSTER_NAME \
    --no-enable-gvnic

Dépannage

Pour résoudre les problèmes liés à la gVNIC, consultez la section Dépannage de la carte d'interface réseau virtuelle Google.

Étape suivante