Nesta página, descrevemos problemas que podem surgir durante a criação de instâncias do Deep Learning VM Image e como lidar com eles.
Cota excedida
Sintoma: - Quota 'NVIDIA_P4_GPUS' exceeded. Limit: 0.0 in region
us-east1.
Problema: você não tem cota suficiente.
Solução: é preciso ter uma cota de GPU para poder criar instâncias com GPUs. Confira se há GPUs disponíveis no projeto na página de cotas. Se as GPUs não estiverem listadas nessa página ou se você precisar de cotas complementares, solicite um aumento de cota. Se seu projeto tiver um histórico de faturamento estabelecido, ele receberá cota automaticamente após o envio da solicitação. Por padrão, as contas de avaliação gratuita não recebem cota de GPU.
Lembre-se de que GPUs preemptivas e GPUs normais exigem solicitações de cota separadas. Não é possível usar a cota de GPU preemptiva para GPUs normais. Além disso, a cota é por região, portanto, verifique se você está criando a instância na região em que tem cota.
Recurso não encontrado
Sintoma: - The resource 'projects/deeplearning-platform/zones/europe-west4-c/acceleratorTypes/nvidia-tesla-p4'
was not found
Problema: você está tentando criar uma instância com uma ou mais GPUs em uma
região onde elas não estão disponíveis (por exemplo, uma instância com uma GPU P4 em
europe-west4-c
).
Solução: para determinar qual região tem a GPU necessária, consulte GPUs no Compute Engine.
Instâncias preemptivas
Sintoma: não consigo criar uma instância preemptiva a partir da IU, mesmo que eu tenha cota.
Solução: no momento, não é possível criar uma instância preemptiva pelo Google Cloud Marketplace. Você precisa usar a CLI. Adicione --preemptible
ao configurar a nova instância.
Não foi possível usar o encaminhamento de portas SSH para se conectar ao JupyterLab
Sintoma: ao usar o encaminhamento de portas SSH para se conectar ao JupyterLab, não será possível se conectar à instância.
Problema: você está tentando se conectar ao soquete TCP errado.
Solução:
Em alguns clientes Linux, o localhost é resolvido para o endereço de loopback IPv6 (
::1
). Verifique isso usandoping -c 1 localhost
. Se este comando retornar o endereço IPv6, use-L 8080:127.0.0.1:8080
(em vez de-L 8080:localhost:8080
) no comandogcloud compute ssh
.Verifique se você se conectou a
http://localhost:8080
(em vez dehttps://localhost:8080
) no seu cliente local.
Suporte da comunidade
Faça uma pergunta sobre a VM de aprendizado profundo no Stack Estourar ou participe do google-dl-platform Grupo do Google para discutir a VM de aprendizado profundo.
Saiba mais sobre como receber suporte da comunidade.