Netzwerktraffic-Geschwindigkeit für GPU-Knoten erhöhen


Auf dieser Seite erfahren Sie, wie Sie die Netzwerkbandbreite für GPU-Knoten in GKE-Clustern (Google Kubernetes Engine) mithilfe von Google Virtual NIC (gVNIC) erhöhen.

In Autopilot-Clustern wird auf Knoten, auf denen die GKE-Version 1.30.2-gke.1023000 oder höher ausgeführt wird, automatisch eine Google Virtual NIC (gVNIC) installiert. Die Anleitung auf dieser Seite gilt nur für Standardcluster.

Hinweise

Führen Sie die folgenden Schritte durch, bevor Sie beginnen:

  • Aktivieren Sie die Google Kubernetes Engine API.
  • Google Kubernetes Engine API aktivieren
  • Wenn Sie die Google Cloud CLI für diese Aufgabe verwenden möchten, müssen Sie die gcloud CLI installieren und dann initialisieren. Wenn Sie die gcloud CLI bereits installiert haben, rufen Sie die neueste Version mit gcloud components update ab.

Beschränkungen

Voraussetzungen

  • GKE-Knoten müssen ein Knoten-Image für Container-Optimized OS verwenden.

gVNIC aktivieren

Sie können einen Cluster mit Knotenpools erstellen, die gVNIC verwenden, einen Knotenpool mit aktivierter gVNIC erstellen oder einen Knotenpool aktualisieren, um gVNIC zu verwenden.

Cluster erstellen

Erstellen Sie einen Cluster mit Knotenpools, die gVNIC verwenden:

gcloud container clusters create CLUSTER_NAME \
    --accelerator type=GPU_TYPE,count=AMOUNT \
    --machine-type=MACHINE_TYPE \
    --enable-gvnic

Dabei gilt:

  • CLUSTER_NAME ist der Name des neuen Clusters.
  • GPU_TYPE: der Typ des GPU-Beschleunigers, den Sie verwenden. Beispiel: nvidia-tesla-t4
  • AMOUNT: Die Anzahl der GPUs, die an Knoten im Knotenpool angehängt werden sollen.
  • MACHINE_TYPE: Der Maschinentyp, den Sie verwenden möchten. gVNIC wird auf speicheroptimierten Maschinentypen nicht unterstützt.

Knotenpool erstellen

Erstellen Sie einen Knotenpool, der gVNIC verwendet:

gcloud container node-pools create NODEPOOL_NAME \
    --cluster=CLUSTER_NAME \
    --enable-gvnic

Dabei gilt:

  • NODEPOOL_NAME: Der Name eines neuen Knotenpools.
  • CLUSTER_NAME den Namen des vorhandenen Clusters.

Knotenpool aktualisieren

Aktualisieren Sie einen Knotenpool, um gVNIC zu verwenden:

gcloud container node-pools update NODEPOOL_NAME \
    --cluster=CLUSTER_NAME \
    --enable-gvnic

Dabei gilt:

  • NODEPOOL_NAME: Den Namen des Knotenpools, den Sie aktualisieren möchten.
  • CLUSTER_NAME den Namen des vorhandenen Clusters.

gVNIC deaktivieren

Aktualisieren Sie den Knotenpool mit dem Flag --no-enable-gvnic:

gcloud container node-pools update NODEPOOL_NAME \
    --cluster=CLUSTER_NAME \
    --no-enable-gvnic

Fehlerbehebung

Informationen zur Fehlerbehebung für gVNIC finden Sie unter Fehlerbehebung bei Google Virtual NIC.

Nächste Schritte