Diese Dokumentation bezieht sich auf die neueste Version der Knative-Bereitstellung, die Flotten und Anthos Service Mesh verwendet. Weitere Informationen

Die ältere Version (Cloud Run for Anthos) wurde archiviert, die Dokumentation ist aber weiterhin für bestehende Nutzer verfügbar.

Verfügbare Versionen

Neueste
Archivieren

NVIDIA-GPUs verwenden

Auf dieser Seite wird beschrieben, wie Sie Deep-Learning-Aufgaben wie Bilderkennung, Natural Language Processing und andere rechenintensive Aufgaben mithilfe von Knotenpools mit Hardwarebeschleunigern von NVIDIA-Grafikprozessoren (GPU) für Rechenleistung mit Ihrer Knative-Containerinstanz ausführen.

Knotenpool mit GPUs einem GKE-Cluster hinzufügen

Ein Administrator soll einen Knotenpool mit GPUs erstellen:

Dienst für die Nutzung von GPUs einrichten

Sie können ein Ressourcenlimit für die Nutzung von GPUs für Ihren Dienst über die Google Cloud Console oder die Google Cloud CLI angeben, wenn Sie einen neuen Dienst bereitstellen, einen vorhandenen Dienst aktualisieren oder eine Überarbeitung bereitstellen:

Console

Zur Knative-Bereitstellung
Klicken Sie auf Dienst erstellen, um das Formular Dienst erstellen aufzurufen.
Führen Sie im Abschnitt Diensteinstellungen Folgendes aus:
1. Wählen Sie den GKE-Cluster mit dem GPU-fähigen Knotenpool aus.
2. Geben Sie den Namen an, den Sie dem Dienst geben möchten.
3. Klicken Sie auf Weiter, um mit dem nächsten Abschnitt fortzufahren.
Gehen Sie im Abschnitt Erste Überarbeitung des Dienstes konfigurieren so vor:
1. Fügen Sie eine Container-Image-URL hinzu.
2. Klicken Sie auf Erweiterte Einstellungen und wählen Sie im Menü Zugewiesene GPU die Anzahl der GPUs aus, die Sie Ihrem Dienst zuweisen möchten.
Klicken Sie auf Weiter, um mit dem nächsten Abschnitt fortzufahren.
Wählen Sie im Abschnitt Konfigurieren, wie dieser Dienst ausgelöst wird die Verbindung aus, die Sie zum Auslösen des Dienstes verwenden möchten.
Klicken Sie auf Erstellen, um das Image für Knative bereitzustellen, und warten Sie, bis die Bereitstellung abgeschlossen ist.

Befehlszeile

Sie können die Konfiguration eines vorhandenen Dienstes in eine YAML-Datei herunterladen – mit dem gcloud run services describe-Befehl mithilfe des Flags --format=export. Sie können diese YAML-Datei dann ändern und diese Änderungen mit dem Befehl gcloud run services replace bereitstellen. Sie müssen sicherstellen, dass Sie nur die angegebenen Attribute ändern.

Laden Sie die Konfiguration des Dienstes in eine Datei mit dem Namen service.yaml im lokalen Arbeitsbereich herunter:
```
gcloud run services describe SERVICE --format export > service.yaml
```
Ersetzen Sie SERVICE durch den Namen Ihres Knative-Bereitstellungsdienstes.

Aktualisieren Sie in Ihrer lokalen Datei das Attribut nvidia.com/gpu:

apiVersion: serving.knative.dev/v1
kind: Service
metadata:
name: SERVICE_NAME
spec:
template:
 spec:
   containers:
   – image: IMAGE_URL
     resources:
       limits:
        nvidia.com/gpu: "GPU_UNITS"

Ersetzen Sie GPU_UNITS durch den gewünschten GPU-Wert in Kubernetes-GPU-Einheiten. Geben Sie beispielsweise 1 für 1 GPU an.

Stellen Sie die YAML-Datei bereit und ersetzen Sie den Dienst durch die neue Konfiguration, indem Sie den folgenden Befehl ausführen:
```
gcloud run services replace service.yaml
```

Weitere Informationen zu GPU-Leistung und -Kosten finden Sie unter GPUs.