新しい VM インスタンスに NVIDIA ドライバをインストールするのに時間がかかる場合があります。特に、大量のイメージを作成しているときに、こうした状況が発生します。この問題の対処策として、Deep Learning VM イメージの 1 つに基づいた独自のイメージを作成する方法があります。ただし、このイメージには NVIDIA ドライバがプリインストールされている必要があります。
このトピックでは、既存の Deep Learning VM イメージに基づいて新しいイメージを作成する方法について説明します。
新しいインスタンスを作成する
まず、次のトピックのいずれかの手順で新しいインスタンスを作成します。新しいインスタンスに少なくとも 1 つの GPU を含めるようにしてください。
- TensorFlow Deep Learning VM インスタンスを作成する
- PyTorch Deep Learning VM インスタンスを作成する
- コマンドラインから Deep Learning VM インスタンスを作成する
- Cloud Marketplace から Deep Learning VM インスタンスを作成する
NVIDIA ドライバのインストールを確認する
インスタンスが起動したら、NVIDIA ドライバがインストールされていることを確認します。
- イメージに SSH で接続します。
gcloud compute ssh "DEPLOYMENT_NAME"
- 以下のコマンドを実行します。
nvidia-smi
ドライバがインストールされたら、処理を続行できます。
インスタンスを停止する
次のコマンドを実行して、インスタンスを停止します。
gcloud compute instances stop "DEPLOYMENT_NAME"
独自のイメージを作成する
次に、停止したインスタンスに基づいて独自のイメージを作成します。コマンドラインで次のコマンドを実行し、新しいイメージに名前とファミリー名を付けます。
gcloud compute images create "NEW_IMAGE_NAME" \ --source-disk DEPLOYMENT_NAME \ --source-disk-zone ZONE \ --family NEW_FAMILY_NAME
コマンドの実行が完了すると、NVIDIA ドライバがプリインストールされた新しいイメージが作成され、これを使用して新しい Deep Learning VM インスタンスを作成できます。