Risoluzione dei problemi

Questa pagina descrive i problemi che possono verificarsi durante la creazione di istanze di Deep Learning VM Images e spiega come risolverli.

Quota superata

Sintomo: - Quota 'NVIDIA_P4_GPUS' exceeded. Limit: 0.0 in region us-east1.

Problema: non disponi di una quota sufficiente.

Soluzione: devi disporre di una quota di GPU prima di poter creare istanze con GPU. Consulta la pagina Quote per assicurarti di disporre di un numero sufficiente di GPU nel progetto. Se le GPU non sono elencate nella pagina delle quote o se hai bisogno di una quota di GPU aggiuntiva, richiedi un aumento della quota. Se il tuo progetto ha una cronologia della fatturazione stabilita, riceverà la quota automaticamente dopo l'invio della richiesta. Per impostazione predefinita, gli account in prova gratuita non ricevono una quota per le GPU.

Tieni presente che le GPU preemptible e le GPU normali richiedono richieste di quota separate. Non puoi utilizzare la quota di GPU prerilasciabile per le GPU normali. Inoltre, la quota è per regione, quindi assicurati di creare l'istanza nella regione in cui hai una quota.

Risorsa non trovata

Sintomo: - The resource 'projects/deeplearning-platform/zones/europe-west4-c/acceleratorTypes/nvidia-tesla-p4' was not found

Problema: stai tentando di creare un'istanza con una o più GPU in una regione in cui le GPU non sono disponibili (ad esempio, un'istanza con una GPU P4 in europe-west4-c).

Soluzione: per determinare quale regione dispone della GPU richiesta, consulta GPU su Compute Engine.

Istanze preemptible

Sintomo: non riesco a creare un'istanza preemptible dalla UI, anche se ho una quota.

Soluzione: al momento non è possibile creare un'istanza preemptive da Google Cloud Marketplace. Devi utilizzare l'interfaccia a riga di comando. Assicurati di aggiungere --preemptible quando configuri la nuova istanza.

Impossibile utilizzare l'inoltro delle porte SSH per connettersi a JupyterLab

Sintomo: quando utilizzi il port forwarding SSH per connetterti a JupyterLab, non riesci a connetterti all'istanza.

Problema: stai tentando di connetterti al socket TCP sbagliato.

Soluzione:

  • Su alcuni client Linux, localhost viene risolto nell'indirizzo di loopback IPv6 (::1). Controlla questo aspetto utilizzando ping -c 1 localhost. Se questo comando restituisce l'indirizzo IPv6, utilizza -L 8080:127.0.0.1:8080 (anziché -L 8080:localhost:8080) nel comando gcloud compute ssh.

  • Assicurati di connetterti a http://localhost:8080 (anziché a https://localhost:8080) sul client locale.

Assistenza dalla community

Fai una domanda su Deep Learning VM su Stack Overflow o unisciti al gruppo Google google-dl-platform per discutere di Deep Learning VM.

Scopri di più su come ricevere assistenza dalla community.