问题排查

本页面介绍了在创建 Deep Learning VM Image 映像实例时可能出现的问题,以及如何解决这些问题。

超出配额

症状- Quota 'NVIDIA_K80_GPUS' exceeded. Limit: 0.0 in region us-east1.

问题:没有足够的配额。

解决方案:您必须具有 GPU 配额才能创建具有 GPU 的实例。 请查看配额页面,确保您的项目具有足够的 GPU 可用。如果配额页面上未列出 GPU,或者您需要额外的 GPU 配额,请申请增加配额。如果您的项目已建立账单历史记录,那么在您提交申请后,项目将自动获得配额。 默认情况下,免费试用账号不会获得 GPU 配额。

请注意,对于抢占式 GPU 和普通 GPU,需要分别申请配额。您不能将抢占式 GPU 配额用于普通 GPU。此外,配额是按区域分配的,因此请务必在您拥有相应配额的区域中创建实例。

找不到资源

症状- The resource 'projects/deeplearning-platform/zones/europe-west4-c/acceleratorTypes/nvidia-tesla-k80' was not found

问题:您正试图在未提供 GPU 的区域中创建具有一个或多个 GPU 的实例(例如,在 europe-west4-c 中创建具有 K80 GPU 的实例)。

解决方案:如需确定哪个区域具有所需的 GPU,请参阅 Compute Engine 上的 GPU

抢占式实例

症状:即使我有配额,也无法通过界面创建抢占式实例。

解决方案:目前,您无法通过 Google Cloud Marketplace 创建抢占式实例。您必须使用 CLI。在设置新实例时,请务必添加 --preemptible

无法使用 SSH 端口转发连接到 JupyterLab

症状:尝试使用 SSH 端口转发连接到 JupyterLab 时,无法连接到实例。

问题:您在尝试连接到错误的 TCP 套接字。

解决方案

  • 在某些 Linux 客户端上,localhost 会解析为 IPv6 环回地址 (::1)。您可以使用 ping -c 1 localhost 对此进行确认。如果此命令返回 IPv6 地址,请在 gcloud compute ssh 命令中使用 -L 8080:127.0.0.1:8080(而不是 -L 8080:localhost:8080)。

  • 确保在本地客户端上连接到 http://localhost:8080(而不是 https://localhost:8080)。

社区支持

Stack Overflow 上提出有关 Deep Learning VM 的问题,或加入 google-dl-platform Google 群组讨论 Deep Learning VM。

详细了解如何从社区获取支持