本页面介绍了在创建 Deep Learning VM Image 映像实例时可能出现的问题,以及如何解决这些问题。
超出配额
症状:- Quota 'NVIDIA_P4_GPUS' exceeded. Limit: 0.0 in region
us-east1.
问题:没有足够的配额。
解决方案:您必须具有 GPU 配额才能创建具有 GPU 的实例。 请查看配额页面,确保您的项目具有足够的 GPU 可用。如果配额页面上未列出 GPU,或者您需要额外的 GPU 配额,请申请增加配额。如果您的项目已建立账单历史记录,那么在您提交申请后,项目将自动获得配额。 默认情况下,免费试用账号不会获得 GPU 配额。
请注意,对于抢占式 GPU 和普通 GPU,需要分别申请配额。您不能将抢占式 GPU 配额用于普通 GPU。此外,配额是按区域分配的,因此请务必在您拥有相应配额的区域中创建实例。
找不到资源
症状:- The resource 'projects/deeplearning-platform/zones/europe-west4-c/acceleratorTypes/nvidia-tesla-p4'
was not found
问题:您正试图在未提供 GPU 的区域中创建具有一个或多个 GPU 的实例(例如,在 europe-west4-c
中创建具有 P4 GPU 的实例)。
解决方案:如需确定哪个区域具有所需的 GPU,请参阅 Compute Engine 上的 GPU。
抢占式实例
症状:即使我有配额,也无法通过界面创建抢占式实例。
解决方案:目前,您无法通过 Google Cloud Marketplace 创建抢占式实例。您必须使用 CLI。在设置新实例时,请务必添加 --preemptible
。
无法使用 SSH 端口转发连接到 JupyterLab
症状:尝试使用 SSH 端口转发连接到 JupyterLab 时,无法连接到实例。
问题:您在尝试连接到错误的 TCP 套接字。
解决方案:
在某些 Linux 客户端上,localhost 会解析为 IPv6 环回地址 (
::1
)。您可以使用ping -c 1 localhost
对此进行确认。如果此命令返回 IPv6 地址,请在gcloud compute ssh
命令中使用-L 8080:127.0.0.1:8080
(而不是-L 8080:localhost:8080
)。确保在本地客户端上连接到
http://localhost:8080
(而不是https://localhost:8080
)。
社区支持
在 Stack 上提出有关 Deep Learning VM 的问题 溢出 或加入 google-dl-platform 用于讨论 Deep Learning VM 的 Google 群组。