GPU が割り当てられたインスタンスの作成の概要


Compute Engine は、仮想マシン(VM)に追加できるグラフィック プロセッシング ユニット(GPU)を備えています。これらの GPU を使用して、VM で実行される ML やデータ処理などの特定のワークロードを高速化できます。

一部の GPU マシンタイプは AI Hypercomputer でも使用できます。AI Hypercomputer は、AI と ML のワークロードをサポートするように最適化されたスーパーコンピューティング システムです。このオプションは、Google Kubernetes Engine(GKE)スケジューラや Slurm スケジューラの統合を含む、パフォーマンスが最適化された密な割り当てのインフラストラクチャを作成する場合に推奨されます。

このドキュメントでは、GPU がアタッチされた VM を作成するために必要な手順の概要について説明します。

Compute Engine 上の GPU の詳細については、GPU についてをご覧ください。

GPU モデルを選択する

利用可能な GPU モデルのリストについては、GPU プラットフォームをご覧ください。また、選択した GPU モデルでサポートされているマシンタイプをメモしておいてください。

モデルごとに、次の点も確認することをおすすめします。

制限事項

GPU を備えたすべての VM の制限に加えて、GPU が割り当てられた各マシンシリーズには次の制限があります。

A4 VM

A3 Ultra VM

  • 容量をリクエストできるのは、A3 Ultra マシンタイプのサポートされているプロビジョニング オプションを使用する場合のみです。
  • A3 Ultra マシンタイプを使用する VM は、継続利用割引フレキシブル確約利用割引の対象外となります。
  • A3 Ultra マシンタイプは、特定のリージョンとゾーンでのみ使用できます。
  • A3 Ultra マシンタイプを使用する VM では、Persistent Disk(リージョンまたはゾーン)を使用できません。
  • A3 Ultra マシンタイプは、Emerald Rapids CPU プラットフォームでのみ使用できます。
  • 既存の VM のマシンタイプを A3 Ultra マシンタイプに変更することはできません。新しい A3-ultra VM の作成は可能です。A3 Ultra マシンタイプを使用して VM を作成した後、マシンタイプを変更することはできません。
  • A3 Ultra マシンタイプは、単一テナンシーをサポートしません。
  • A3 Ultra マシンタイプでは Windows オペレーティング システムを実行できません。

A3 Mega VM

A3 High VM

  • 容量をリクエストできるのは、A3 High マシンタイプのサポートされているプロビジョニング オプションを使用する場合のみです。
  • A3 High マシンタイプを使用する VM は、継続利用割引フレキシブル確約利用割引の対象外となります。
  • A3 High マシンタイプは、特定のリージョンとゾーンでのみ使用できます。
  • A3 High マシンタイプを使用する VM では、リージョン Persistent Disk を使用できません。
  • A3 High マシンタイプは、Sapphire Rapids CPU プラットフォームでのみ使用できます。
  • 既存の VM のマシンタイプを A3 High マシンタイプに変更することはできません。新しい A3-high VM の作成は可能です。A3 High マシンタイプを使用して VM を作成した後、マシンタイプを変更することはできません。
  • A3 High マシンタイプは、単一テナンシーをサポートしません。
  • A3 High マシンタイプでは Windows オペレーティング システムを実行できません。
  • a3-highgpu-1ga3-highgpu-2ga3-highgpu-4g マシンタイプには、次の制限が適用されます。
    • これらのマシンタイプでは、Spot VM を使用するか、Dynamic Workload Scheduler(DWS)を利用する機能(MIG でのサイズ変更リクエストなど)を使用して VM を作成する必要があります。これらのオプションの詳しい使用方法については以下をご覧ください。
    • 予約を作成できません。
    標準プロビジョニングを使用して VM を作成しようとした場合、またはこれらのマシンタイプの予約を作成しようとした場合、エラー メッセージが返されます。

A3 Edge VM

A2 標準 VM

  • 容量をリクエストできるのは、A2 標準マシンタイプのサポートされているプロビジョニング オプションを使用する場合のみです。
  • A2 標準マシンタイプを使用する VM は、継続利用割引フレキシブル確約利用割引の対象外となります。
  • A2 標準マシンタイプは、特定のリージョンとゾーンでのみ使用できます。
  • A2 標準マシンタイプは、Cascade Lake プラットフォームでのみ使用できます。
  • VM が A2 標準マシンタイプを使用している場合は、ある A2 標準マシンタイプから別の A2 標準マシンタイプにのみ切り替えることができます。他のマシンタイプには変更できません。詳細については、アクセラレータ最適化 VM を変更するをご覧ください。
  • <codea2-megagpu-16g< code="" dir="ltr" translate="no">A2 標準マシンタイプでは Windows オペレーティング システムを使用できません。Windows オペレーティング システムを使用する場合は、別の A2 標準マシンタイプを選択する必要があります。</codea2-megagpu-16g<>
  • A2 標準マシンタイプを使用する Windows VM では、アタッチされたローカル SSD のクイック フォーマットを行うことができません。これらのローカル SSD をフォーマットするには、diskpart ユーティリティを使用し、format fs=ntfs label=tmpfs を指定して完全フォーマットを行う必要があります。
  • A2 標準マシンタイプは、単一テナンシーをサポートしません。

A2 Ultra VM

  • 容量をリクエストできるのは、A2 Ultra マシンタイプのサポートされているプロビジョニング オプションを使用する場合のみです。
  • A2 Ultra マシンタイプを使用する VM は、継続利用割引フレキシブル確約利用割引の対象外となります。
  • A2 Ultra マシンタイプは、特定のリージョンとゾーンでのみ使用できます。
  • A2 Ultra マシンタイプは、Cascade Lake プラットフォームでのみ使用できます。
  • VM が A2 Ultra マシンタイプを使用している場合、マシンタイプを変更することはできません。別の A2 Ultra マシンタイプやその他のマシンタイプを使用するには、新しい VM を作成する必要があります。
  • 他のマシンタイプを A2 Ultra マシンタイプに変更することはできません。A2 Ultra マシンタイプを使用する VM が必要な場合は、新しい VM を作成する必要があります。
  • A2 Ultra マシンタイプを使用する Windows VM では、アタッチされたローカル SSD のクイック フォーマットを行うことができません。これらのローカル SSD をフォーマットするには、diskpart ユーティリティを使用し、format fs=ntfs label=tmpfs を指定して完全フォーマットを行う必要があります。

G2 VM

  • 容量をリクエストできるのは、G2 マシンタイプのサポートされているプロビジョニング オプションを使用する場合のみです。
  • G2 マシンタイプを使用する VM は、継続利用割引フレキシブル確約利用割引の対象外となります。
  • G2 マシンタイプは、特定のリージョンとゾーンでのみ使用できます。
  • G2 マシンタイプは、Cascade Lake プラットフォームでのみ使用できます。
  • 標準永続ディスク(pd-standard)は、G2 標準マシンタイプを使用する VM ではサポートされません。サポートされているディスクタイプについては、G2 でサポートされているディスクタイプをご覧ください。
  • G2 マシンタイプでマルチインスタンス GPU を作成することはできません。
  • G2 VM のマシンタイプを変更する必要がある場合は、アクセラレータ最適化 VM を変更するをご覧ください。
  • G2 マシンタイプを使用する VM のブートディスクに Deep Learning VM Image を使用することはできません。
  • Container-Optimized OS の現在のデフォルト ドライバは、G2 マシンタイプで実行される L4 GPU をサポートしていません。Container-Optimized OS は、特定のドライバセットのみをサポートしています。G2 マシンタイプで Container-Optimized OS を使用する場合は、次の点に注意してください。
    • 推奨される最小の NVIDIA ドライバ バージョン 525.60.13 以降をサポートする Container-Optimized OS のバージョンを使用します。詳細については、Container-Optimized OS のリリースノートをご覧ください。
    • ドライバをインストールするときに、L4 GPU で動作する最新のバージョンを指定します。例: sudo cos-extensions install gpu -- -version=525.60.13
  • 次のシナリオでは、Google Cloud CLI または REST を使用して G2 VM を作成する必要があります。
    • カスタムメモリ値を指定する必要があります。
    • 表示可能な CPU コアの数をカスタマイズする必要があります。

N1+GPU VM

GPU を使用する N1 インスタンスの制限事項については、N1 マシンシリーズの機能N1 マシンシリーズの GPU をご覧ください。

オペレーティング システムを選択する

ML に GPU を使用している場合は、次のいずれかのオペレーティング システムを使用します。

  • AI ワークロード用に最適化されたイメージ。Ubuntu イメージと Rocky イメージを使用できます。これらのイメージは、ドライバと CUDA ツールキットがプリインストールされたアクセラレータ向けの最適化バージョンで利用できます。AI Hypercomputer のドキュメントで OS イメージをご覧ください。
  • Deep Learning VM Image。各 Deep Learning VM には GPU ドライバのインストール ツールがあり、TensorFlow や PyTorch などのパッケージが含まれています。一般的な GPU ワークロードに Deep Learning VM Image を使用することもできます。使用可能なイメージと、これらのイメージにインストールされているパッケージの詳細については、イメージの選択をご覧ください。

また、公開イメージまたはカスタム イメージを使用することもできます。一部のイメージでは、独自のドライバが必要な場合や、Compute Engine ドキュメントの範囲外のインストール プロセスが必要な場合があります。OS イメージに適したドライバを確認するには、GPU ドライバのインストールをご覧ください。

GPU 割り当てを確認する

Compute Engine システムとユーザーを保護するため、新しいプロジェクトにはグローバル GPU 割り当てが設定されます。この割り当ては、サポート対象のすべてのゾーンで作成できる GPU の総数を制限するものです。GPU の割り当てを確認するには、GPU の割り当てをご覧ください。

追加の GPU 割り当てが必要な場合は、割り当ての増加をリクエストします。GPU 割り当てをリクエストするときは、各リージョンで作成する GPU タイプに対する割り当てと、すべてのゾーンのすべての GPU タイプの合計数に対する追加のグローバル割り当てをリクエストする必要があります。

プロジェクトに確定済みのお支払い履歴がある場合、リクエストの送信後に割り当てが自動的にプロジェクトで受信されます。

GPU VM とプリエンプティブルの数量に基づく割り当て

通常、標準プロビジョニング モデルを使用する VM は、プリエンプティブルの数量に基づく割り当てを使用できません。プリエンプティブル割り当ては一時的なワークロードを対象としており、通常はより利用しやすいものです。プロジェクトにプリエンプティブル割り当てがなく、プリエンプティブル割り当てをリクエストしたことがない場合、プロジェクト内のすべての VM は標準の数量に基づく割り当てを使用します。

プリエンプティブルの数量に基づく割り当てをリクエストする場合、標準プロビジョニング モデルを使用する VM は、プリエンプティブルの数量に基づく割り当てを使用するために次のすべての条件を満たす必要があります。

時間制限のある GPU ワークロードにプリエンプティブル割り当てを使用すると、連続実行時間とプリエンプティブルの数量に基づく割り当ての高取得可能性の両方のメリットを享受できます。詳細については、プリエンプティブル割り当てをご覧ください。

GPU が接続された VM を作成する

GPU がアタッチされた VM を作成するには、次の操作を行います。

  1. VM を作成します。VM の作成方法は GPU のモデルによって異なります。

  2. VM で GPU を使用するには、VM に GPU ドライバをインストールする必要があります。NVIDIA RTX 仮想ワークステーション(旧称 NVIDIA GRID)を有効にした場合は、仮想ワークステーション用のドライバをインストールします。

次のステップ