在新的虚拟机实例上安装 NVIDIA 驱动程序可能非常耗时,尤其是在创建大量映像时。避免这种情况的一种方法是创建您自己的映像,该映像基于 Deep Learning VM 映像之一,但已经预先安装了 NVIDIA 驱动程序。
本主题介绍如何基于现有 Deep Learning VM 映像创建新映像。
创建新实例
首先,请按照以下主题之一中的说明创建新实例。请务必在新实例中至少包含一个 GPU。
- 创建 TensorFlow Deep Learning VM 实例
- 创建 PyTorch Deep Learning VM 实例
- 从命令行创建 Deep Learning VM 实例
- 从 Cloud Marketplace 创建 Deep Learning VM 实例
验证 NVIDIA 驱动程序安装
实例启动后,请验证 NVIDIA 驱动程序是否已安装:
- 通过 SSH 连接到您的映像:
gcloud compute ssh "DEPLOYMENT_NAME"
- 运行以下命令:
nvidia-smi
如果已安装驱动程序,则可以继续操作。
停止实例
通过运行以下命令停止实例:
gcloud compute instances stop "DEPLOYMENT_NAME"
创建您自己的映像
现在,您可以基于已停止的实例创建自己的映像。在命令行运行以下命令,并为新映像提供名称和系列名称:
gcloud compute images create "NEW_IMAGE_NAME" \ --source-disk DEPLOYMENT_NAME \ --source-disk-zone ZONE \ --family NEW_FAMILY_NAME
命令运行完毕后,您会获得一个预装了 NVIDIA 驱动程序的新映像,可用来创建新的 Deep Learning VM 实例。