在新的 VM 執行個體上安裝 NVIDIA 驅動程式可能相當費時,特別是建立多個映像檔時。防止這類情況發生的其中一個方法,就是根據其中一個已預先安裝 NVIDIA 驅動程式的深度學習 VM 映像檔,來建立自己的映像檔。
本主題說明如何根據現有的深度學習 VM 映像檔建立新的映像檔。
建立新執行個體
首先,請按照下列其中一個主題的操作說明建立新的執行個體,並務必在新的執行個體中至少指定一個 GPU。
- 建立 TensorFlow 深度學習 VM 執行個體
- 建立 PyTorch 深度學習 VM 執行個體
- 透過指令列建立深度學習 VM 執行個體
- 透過 Cloud Marketplace 建立深度學習 VM 執行個體
確認 NVIDIA 驅動程式已安裝成功
執行個體啟動後,請確認 NVIDIA 驅動程式已安裝成功:
- 將 SSH 套用至映像檔:
gcloud compute ssh "DEPLOYMENT_NAME"
- 執行下列指令:
nvidia-smi
如果驅動程式已安裝成功,即可繼續。
停止執行個體
執行下列指令即可停止執行個體:
gcloud compute instances stop "DEPLOYMENT_NAME"
建立自己的映像檔
現在您可以根據已停止的執行個體建立自己的映像檔。在指令列執行下列指令,為新的映像檔加上名稱和系列名稱:
gcloud compute images create "NEW_IMAGE_NAME" \ --source-disk DEPLOYMENT_NAME \ --source-disk-zone ZONE \ --family NEW_FAMILY_NAME
指令執行結束後,即完成內含已預先安裝 NVIDIA 驅動程式的新映像檔,可用來建立新的深度學習 VM 執行個體。