Fehlerbehebung

Auf dieser Seite werden Probleme beschrieben, die beim Erstellen von Deep Learning VM Images-Instanzen auftreten können. Außerdem wird erläutert, wie diese Probleme behoben werden können.

Kontingent überschritten

Symptom: - Quota 'NVIDIA_K80_GPUS' exceeded. Limit: 0.0 in region us-east1.

Problem: Ihr Kontingent ist nicht ausreichend.

Lösung: Für die Erstellung von Instanzen mit GPUs benötigen Sie ein GPU-Kontingent. Prüfen Sie auf der Seite Kontingente, ob in Ihrem Projekt ausreichend GPUs zur Verfügung stehen. Wenn auf der Seite "Kontingente" keine GPUs aufgeführt sind oder Sie zusätzliche GPU-Kontingente benötigen, können Sie eine Erhöhung des Kontingents beantragen. Wenn Ihr Projekt einen bestehenden Abrechnungsverlauf hat, erhält es nach Ihrer Anfrage automatisch Kontingente. Kostenlose Testkonten erhalten standardmäßig kein GPU-Kontingent.

Bedenken Sie, dass Kontingente für GPUs auf Abruf und für normale GPUs separat beantragt werden müssen. Ein Kontingent für GPUs auf Abruf kann nicht für normale GPUs genutzt werden. Außerdem gelten Kontingente für die jeweilige Region. Erstellen Sie daher die Instanz unbedingt in der Region, für die Sie Kontingente haben.

Ressource ist nicht vorhanden.

Symptom: - The resource 'projects/deeplearning-platform/zones/europe-west4-c/acceleratorTypes/nvidia-tesla-k80' was not found

Problem: Sie versuchen, eine Instanz mit einer oder mehreren GPUs in einer Region zu erstellen, in der keine GPUs verfügbar sind (z. B. eine Instanz mit einer K80 GPU in europe-west4-c).

Lösung: Unter GPUs in Compute Engine können Sie ermitteln, in welcher Region die erforderliche GPU verfügbar ist.

Instanzen auf Abruf

Symptom: Ich kann keine Instanz auf Abruf über die UI erstellen, obwohl ich Kontingente habe.

Lösung: Derzeit können in Google Cloud Marketplace keine Instanzen auf Abruf erstellt werden. Sie müssen die Befehlszeile verwenden. Achten Sie darauf, beim Einrichten der neuen Instanz --preemptible hinzuzufügen.

SSH-Portweiterleitung kann nicht zum Herstellen einer Verbindung zu JupyterLab verwendet werden

Symptom: Wenn Sie eine SSH-Portweiterleitung zum Herstellen einer Verbindung zu JupyterLab verwenden, können Sie keine Verbindung zur Instanz herstellen.

Problem: Sie versuchen, eine Verbindung zum falschen TCP-Socket herzustellen.

Lösung:

  • Auf einigen Linux-Clients wird der Localhost in die IPv6-Loopback-Adresse (::1) aufgelöst. Verwenden Sie dazu ping -c 1 localhost. Wenn durch diesen Befehl die IPv6-Adresse zurückgegeben wird, verwenden Sie im Befehl gcloud compute ssh -L 8080:127.0.0.1:8080 (statt -L 8080:localhost:8080).

  • Achten Sie darauf, dass Sie auf Ihrem lokalen Client eine Verbindung zu http://localhost:8080 (anstelle von https://localhost:8080) herstellen.

Community-Support

Sie können auf Stack Overflow Fragen zu Deep Learning VM stellen oder der Google-Gruppe google-dl-platform beitreten, um über Deep Learning VM zu diskutieren.

Support von der Community erhalten.