Questa pagina descrive i problemi che possono verificarsi durante la creazione di istanze di immagini VM per il deep learning e spiega come risolverli.
Quota superata
Sintomo: - Quota 'NVIDIA_P4_GPUS' exceeded. Limit: 0.0 in region
us-east1.
Problema: non disponi di quota sufficiente.
Soluzione: devi disporre della quota GPU prima di poter creare istanze con GPU. Consulta la pagina Quote per assicurarti di disporre di un numero sufficiente di GPU nel progetto. Se le GPU non sono elencate nella pagina delle quote o se hai bisogno di una quota GPU aggiuntiva, richiedi un aumento della quota. Se il tuo progetto ha una cronologia di fatturazione consolidata, riceverà automaticamente la quota dopo che avrai inviato la richiesta. Per impostazione predefinita, gli account in prova gratuita non ricevono una quota per le GPU.
Tieni presente che le GPU prerilasciabili e le GPU normali richiedono richieste di quota separate. Non puoi utilizzare la quota GPU preassegnata per le GPU normali. Inoltre, la quota è per regione, quindi assicurati di creare l'istanza nella regione in cui hai la quota.
Risorsa non trovata
Sintomo: - The resource 'projects/deeplearning-platform/zones/europe-west4-c/acceleratorTypes/nvidia-tesla-p4'
was not found
Problema: stai tentando di creare un'istanza con una o più GPU in una regione in cui le GPU non sono disponibili (ad esempio, un'istanza con una GPU P4 in europe-west4-c
).
Soluzione: per determinare quale regione dispone della GPU richiesta, consulta GPU su Compute Engine.
Istanze preemptible
Sintomo: non riesco a creare un'istanza preemptibile dall'interfaccia utente, anche se ho quota.
Soluzione: al momento non è possibile creare un'istanza preeminente da Google Cloud Marketplace. Devi utilizzare l'interfaccia a riga di comando. Assicurati di aggiungere --preemptible
quando configuri la nuova istanza.
Impossibile utilizzare l'inoltro di porte SSH per connettersi a JupyterLab
Sintomo: quando utilizzi il port forwarding SSH per connetterti a JupyterLab, non riesci a connetterti all'istanza.
Problema: stai tentando di connetterti alla socket TCP sbagliata.
Soluzione:
Su alcuni client Linux, localhost viene risolto nell'indirizzo loopback IPv6 (
::1
). Verificalo utilizzandoping -c 1 localhost
. Se questo comando restituisce l'indirizzo IPv6, utilizza-L 8080:127.0.0.1:8080
(anziché-L 8080:localhost:8080
) nel comandogcloud compute ssh
.Assicurati di connetterti a
http://localhost:8080
(anziché ahttps://localhost:8080
) sul client locale.
Assistenza dalla community
Fai una domanda su Deep Learning VM su Stack Overflow o partecipa al gruppo Google google-dl-platform per discutere di Deep Learning VM.
Scopri di più su come ricevere assistenza dalla community.