Esta página descreve os problemas que podem surgir ao criar instâncias de imagens de VMs de aprendizagem profunda e indica como resolvê-los.
Quota excedida
Sintoma: - Quota 'NVIDIA_P4_GPUS' exceeded. Limit: 0.0 in region
us-east1.
Problema: não tem quota suficiente.
Solução: tem de ter quota de GPU antes de poder criar instâncias com GPUs. Consulte a página de quotas para se certificar de que tem GPUs suficientes disponíveis no seu projeto. Se as GPUs não estiverem indicadas na página de quotas ou precisar de uma quota de GPUs adicional, peça um aumento da quota. Se o seu projeto tiver um histórico de faturação estabelecido, recebe automaticamente a quota depois de enviar o pedido. As contas de avaliação gratuita não recebem quota de GPU por predefinição.
Tenha em atenção que as GPUs preemptíveis e as GPUs normais requerem pedidos de quota separados. Não pode usar a quota de GPUs preemptíveis para GPUs normais. Além disso, a quota é por região, por isso, certifique-se de que está a criar a instância na região onde tem quota.
Recurso não localizado
Sintoma: - The resource 'projects/deeplearning-platform/zones/europe-west4-c/acceleratorTypes/nvidia-tesla-p4'
was not found
Problema: está a tentar criar uma instância com uma ou mais GPUs numa região onde as GPUs não estão disponíveis (por exemplo, uma instância com uma GPU P4 em europe-west4-c
).
Solução: para determinar que região tem a GPU necessária, consulte o artigo GPUs no Compute Engine.
Instâncias preemptivas
Sintoma: não consigo criar uma instância preemptível a partir da IU, apesar de ter quota.
Solução: de momento, não é possível criar uma instância preemptível a partir do Google Cloud Marketplace. Tem de usar a CLI. Certifique-se de que adiciona --preemptible
quando configurar a nova instância.
Não é possível usar o encaminhamento de portas SSH para estabelecer ligação ao JupyterLab
Sintoma: quando usa o encaminhamento de portas SSH para se ligar ao JupyterLab, não consegue estabelecer ligação à instância.
Problema: está a tentar estabelecer ligação ao socket TCP errado.
Solução:
Em alguns clientes Linux, o localhost é resolvido para o endereço loopback IPv6 (
::1
). Verifique isto através deping -c 1 localhost
. Se este comando devolver o endereço IPv6, use-L 8080:127.0.0.1:8080
(em vez de-L 8080:localhost:8080
) no comandogcloud compute ssh
.Certifique-se de que se liga a
http://localhost:8080
(em vez dehttps://localhost:8080
) no seu cliente local.
Apoio técnico da comunidade
Faça uma pergunta sobre a VM de aprendizagem avançada no Stack Overflow ou junte-se ao grupo Google google-dl-platform para debater a VM de aprendizagem avançada.
Saiba como receber apoio técnico da comunidade.