Dépannage

Cette page décrit les problèmes qui peuvent survenir lors de la création d'instances Deep Learning VM Image et vous explique comment y remédier.

Quota dépassé

Symptôme : - Quota 'NVIDIA_P4_GPUS' exceeded. Limit: 0.0 in region us-east1.

Problème : Vous ne disposez pas d'un quota suffisant.

Solution : Vous devez disposer d'un quota de GPU pour pouvoir créer des instances dotées de GPU. Consultez la page Quotas pour vous assurer que vous disposez de suffisamment de GPU dans votre projet. Si les GPU ne figurent pas sur la page "Quotas" ou que vous avez besoin d'un quota de GPU supplémentaire, demandez une augmentation de quota. Si votre projet a un historique de facturation établi, il recevra automatiquement un quota après l'envoi de la demande. Par défaut, les comptes en essai gratuit ne reçoivent pas de quota de GPU.

Gardez à l'esprit que vous devez effectuer des demandes distinctes pour les GPU préemptifs et normaux. Vous ne pouvez pas utiliser le quota de GPU préemptifs pour les GPU normaux. En outre, le quota est calculé par région. Par conséquent, veillez à créer l'instance dans la région où vous disposez d'un quota.

Ressource introuvable

Symptôme : - The resource 'projects/deeplearning-platform/zones/europe-west4-c/acceleratorTypes/nvidia-tesla-p4' was not found

Problème: Vous essayez de créer une instance avec un ou plusieurs GPU dans une région où ils ne sont pas disponibles (par exemple, une instance dotée d'un GPU P4 dans la région europe-west4-c).

Solution : Pour déterminer quelle région possède le GPU requis, consultez la page GPU sur Compute Engine.

Instances préemptives

Symptôme : Je ne peux pas créer d'instance préemptive depuis l'interface utilisateur, bien que je dispose d'un quota.

Solution : À ce jour, vous ne pouvez pas créer d'instance préemptive à partir de Google Cloud Marketplace. Vous devez utiliser la CLI. Veillez à ajouter --preemptible lorsque vous configurez votre nouvelle instance.

Impossible d'utiliser le transfert de port SSH pour se connecter à JupyterLab

Problème constaté : lorsque vous utilisez le transfert de port SSH pour vous connecter à JupyterLab, vous ne pouvez pas vous connecter à l'instance.

Problème : vous essayez de vous connecter au mauvais socket TCP.

Solution :

  • Sur certains clients Linux, le localhost est résolu en adresse de bouclage IPv6 (::1). Vérifiez cela à l'aide de ping -c 1 localhost. Si cette commande renvoie l'adresse IPv6, utilisez -L 8080:127.0.0.1:8080 (plutôt que -L 8080:localhost:8080) dans la commande gcloud compute ssh.

  • Assurez-vous de vous connecter à http://localhost:8080 (et non à https://localhost:8080) sur votre client local.

Assistance de la communauté

Posez une question à propos de Deep Learning VM sur Stack Overflow ou rejoignez le groupe Google google-dl-platform pour discuter de Deep Learning VM.

Découvrez comment obtenir de l'aide auprès de la communauté.