インスタンス テンプレートを使用して GPU インスタンスのグループを作成する

インスタンス テンプレートを使用して、各インスタンスに GPU が追加されたマネージド インスタンス グループを作成できます。マネージド インスタンス グループは、テンプレートを使用して同一インスタンスを複数作成します。グループ内のインスタンスの数は、ワークロードに合わせてスケーリングできます。

作成されたインスタンスには CUDA ツールキットと NVIDIA ドライバがインストールされている必要があるため、GPU インスタンスのインスタンス テンプレートは次の手順で作成します。

  1. GPU が接続されているインスタンスを作成します。
  2. GPU ドライバをインスタンスにインストールします。
  3. GPU とドライバがインストールされている VM インスタンスに接続されたディスクからイメージを作成します。
  4. このイメージを使用してインスタンス テンプレートを作成します。
  5. このテンプレートを使用してインスタンス グループを作成します。

始める前に

インスタンス テンプレートを作成する

インスタンス テンプレートの作成手順については、インスタンス テンプレートの作成をご覧ください。

Console

Console を使用してインスタンス テンプレートを作成する場合は、必ず次のカスタマイズを行います。

  • マシンタイプを指定します。
  • GPU とドライバが接続されているカスタム イメージのイメージ名とファミリーを指定します。

カスタム イメージの使用の詳細については、インスタンス テンプレートでのカスタム イメージまたはパブリック イメージの使用をご覧ください。

gcloud

gcloud compute instance-templates create を使用してインスタンス テンプレートを作成するには、--accelerators フラグと --maintenance-policy TERMINATE フラグを含めます。

次の例では、2 つの vCPU、イメージに基づく 250 GB のブートディスク(ドライバがインストールされている)、NVIDIA® Tesla® K80 GPU を指定して、インスタンス テンプレートを作成します。my-imagemy-project は、GPU とドライバが接続されているイメージのイメージ名とプロジェクト名で置き換えます。

gcloud compute instance-templates create gpu-template \
    --machine-type n1-standard-2 \
    --boot-disk-size 250GB \
    --accelerator type=nvidia-tesla-k80,count=1 \
    --image-family my-image \
    --image-project my-project \
    --maintenance-policy TERMINATE \
    --restart-on-failure

インスタンス グループを作成する

テンプレートを作成したら、そのテンプレートを使用してインスタンス グループを作成します。グループにインスタンスを追加するたびに、インスタンス テンプレートの設定を使用してそのインスタンスが開始されます。

リージョン マネージド インスタンス グループを作成する場合は必ず、必要な GPU モデルを明示的にサポートするゾーンを選択してください。GPU モデルと使用可能なゾーンの一覧については、Compute Engine の GPU をご覧ください。次の例では、nvidia-tesla-k80 モデルをサポートする 2 つのゾーンにまたがるリージョン マネージド インスタンス グループを作成しています。

gcloud compute instance-groups managed create example-rmig \
    --template gpu-template --base-instance-name example-instances \
    --size 30 --zones us-east1-c,us-east1-d

次のステップ