Questa pagina descrive i problemi che possono verificarsi durante la creazione di istanze di Deep Learning VM Images e spiega come risolverli.
Quota superata
Sintomo: - Quota 'NVIDIA_P4_GPUS' exceeded. Limit: 0.0 in region
us-east1.
Problema: non disponi di una quota sufficiente.
Soluzione: devi disporre di una quota di GPU prima di poter creare istanze con GPU. Consulta la pagina Quote per assicurarti di disporre di un numero sufficiente di GPU nel progetto. Se le GPU non sono elencate nella pagina delle quote o se hai bisogno di una quota di GPU aggiuntiva, richiedi un aumento della quota. Se il tuo progetto ha una cronologia della fatturazione stabilita, riceverà la quota automaticamente dopo l'invio della richiesta. Per impostazione predefinita, gli account in prova gratuita non ricevono una quota per le GPU.
Tieni presente che le GPU preemptible e le GPU normali richiedono richieste di quota separate. Non puoi utilizzare la quota di GPU prerilasciabile per le GPU normali. Inoltre, la quota è per regione, quindi assicurati di creare l'istanza nella regione in cui hai una quota.
Risorsa non trovata
Sintomo: - The resource 'projects/deeplearning-platform/zones/europe-west4-c/acceleratorTypes/nvidia-tesla-p4'
was not found
Problema: stai tentando di creare un'istanza con una o più GPU in una regione in cui le GPU non sono disponibili (ad esempio, un'istanza con una GPU P4 in europe-west4-c
).
Soluzione: per determinare quale regione dispone della GPU richiesta, consulta GPU su Compute Engine.
Istanze preemptible
Sintomo: non riesco a creare un'istanza preemptible dalla UI, anche se ho una quota.
Soluzione: al momento non è possibile creare un'istanza preemptive da
Google Cloud Marketplace. Devi utilizzare l'interfaccia a riga di comando. Assicurati di aggiungere --preemptible
quando configuri la nuova istanza.
Impossibile utilizzare l'inoltro delle porte SSH per connettersi a JupyterLab
Sintomo: quando utilizzi il port forwarding SSH per connetterti a JupyterLab, non riesci a connetterti all'istanza.
Problema: stai tentando di connetterti al socket TCP sbagliato.
Soluzione:
Su alcuni client Linux, localhost viene risolto nell'indirizzo di loopback IPv6 (
::1
). Controlla questo aspetto utilizzandoping -c 1 localhost
. Se questo comando restituisce l'indirizzo IPv6, utilizza-L 8080:127.0.0.1:8080
(anziché-L 8080:localhost:8080
) nel comandogcloud compute ssh
.Assicurati di connetterti a
http://localhost:8080
(anziché ahttps://localhost:8080
) sul client locale.
Assistenza dalla community
Fai una domanda su Deep Learning VM su Stack Overflow o unisciti al gruppo Google google-dl-platform per discutere di Deep Learning VM.
Scopri di più su come ricevere assistenza dalla community.