GPU が割り当てられたインスタンスの作成の概要

Linux Windows

Compute Engine は、仮想マシン（VM）に追加できるグラフィックプロセッシングユニット（GPU）を備えています。これらの GPU を使用して、VM で実行される ML やデータ処理などの特定のワークロードを高速化できます。

一部の GPU マシンタイプは AI Hypercomputer でも使用できます。AI Hypercomputer は、AI と ML のワークロードをサポートするように最適化されたスーパーコンピューティングシステムです。このオプションは、Google Kubernetes Engine（GKE）スケジューラや Slurm スケジューラの統合を含む、パフォーマンスが最適化された密な割り当てのインフラストラクチャを作成する場合に推奨されます。

このドキュメントでは、GPU がアタッチされた VM を作成するために必要な手順の概要について説明します。

Compute Engine 上の GPU の詳細については、GPU についてをご覧ください。

GPU モデルを選択する

利用可能な GPU モデルのリストについては、GPU プラットフォームをご覧ください。また、選択した GPU モデルでサポートされているマシンタイプをメモしておいてください。

モデルごとに、次の点も確認することをおすすめします。

サポートされているリージョンとゾーン。
GPU の料金。VM で各 GPU モデルを使用する際の料金を確認します。アクセラレータ最適化マシンを使用する VM については、VM インスタンスの料金もご覧ください。

制限事項

GPU を備えたすべての VM の制限に加えて、GPU が割り当てられた各マシンシリーズには次の制限があります。

A4 VM

容量をリクエストできるのは、A4 マシンタイプのサポートされているプロビジョニングオプションを使用する場合のみです。
A4 マシンタイプを使用する VM は、継続利用割引とフレキシブル確約利用割引の対象外となります。
A4 マシンタイプは、特定のリージョンとゾーンでのみ使用できます。
A4 マシンタイプを使用する VM では、Persistent Disk（リージョンまたはゾーン）を使用できません。
A4 マシンタイプは、Emerald Rapids CPU プラットフォームでのみ使用できます。
既存の VM のマシンタイプを A4 マシンタイプに変更することはできません。新しい A4 VM の作成は可能です。A4 マシンタイプを使用して VM を作成した後、マシンタイプを変更することはできません。
A4 マシンタイプは、単一テナンシーをサポートしません。
A4 マシンタイプでは Windows オペレーティングシステムを実行できません。

A3 Ultra VM

容量をリクエストできるのは、A3 Ultra マシンタイプのサポートされているプロビジョニングオプションを使用する場合のみです。
A3 Ultra マシンタイプを使用する VM は、継続利用割引とフレキシブル確約利用割引の対象外となります。
A3 Ultra マシンタイプは、特定のリージョンとゾーンでのみ使用できます。
A3 Ultra マシンタイプを使用する VM では、Persistent Disk（リージョンまたはゾーン）を使用できません。
A3 Ultra マシンタイプは、Emerald Rapids CPU プラットフォームでのみ使用できます。
既存の VM のマシンタイプを A3 Ultra マシンタイプに変更することはできません。新しい A3-ultra VM の作成は可能です。A3 Ultra マシンタイプを使用して VM を作成した後、マシンタイプを変更することはできません。
A3 Ultra マシンタイプは、単一テナンシーをサポートしません。
A3 Ultra マシンタイプでは Windows オペレーティングシステムを実行できません。

A3 Mega VM

容量をリクエストできるのは、A3 Mega マシンタイプのサポートされているプロビジョニングオプションを使用する場合のみです。
A3 Mega マシンタイプを使用する VM は、継続利用割引とフレキシブル確約利用割引の対象外となります。
A3 Mega マシンタイプは、特定のリージョンとゾーンでのみ使用できます。
A3 Mega マシンタイプを使用する VM では、リージョン Persistent Disk を使用できません。
A3 Mega マシンタイプは、Sapphire Rapids CPU プラットフォームでのみ使用できます。
既存の VM のマシンタイプを A3 Mega マシンタイプに変更することはできません。新しい A3-mega VM の作成は可能です。A3 Mega マシンタイプを使用して VM を作成した後は、マシンタイプを変更できません。
A3 Mega マシンタイプは、単一テナンシーをサポートしません。
A3 Mega マシンタイプでは Windows オペレーティングシステムを実行できません。

A3 High VM

容量をリクエストできるのは、A3 High マシンタイプのサポートされているプロビジョニングオプションを使用する場合のみです。
A3 High マシンタイプを使用する VM は、継続利用割引とフレキシブル確約利用割引の対象外となります。
A3 High マシンタイプは、特定のリージョンとゾーンでのみ使用できます。
A3 High マシンタイプを使用する VM では、リージョン Persistent Disk を使用できません。
A3 High マシンタイプは、Sapphire Rapids CPU プラットフォームでのみ使用できます。
既存の VM のマシンタイプを A3 High マシンタイプに変更することはできません。新しい A3-high VM の作成は可能です。A3 High マシンタイプを使用して VM を作成した後、マシンタイプを変更することはできません。
A3 High マシンタイプは、単一テナンシーをサポートしません。
A3 High マシンタイプでは Windows オペレーティングシステムを実行できません。
a3-highgpu-1g、a3-highgpu-2g、a3-highgpu-4g マシンタイプには、次の制限が適用されます。
- これらのマシンタイプでは、Spot VM を使用するか、Dynamic Workload Scheduler（DWS）を利用する機能（MIG でのサイズ変更リクエストなど）を使用して VM を作成する必要があります。これらのオプションの詳しい使用方法については以下をご覧ください。
  - Spot VM を作成するには、アクセラレータ最適化 VM を作成するときにプロビジョニングモデルを SPOT に設定します。
  - DWS を使用する MIG でサイズ変更リクエストを作成するには、GPU VM を使用する MIG を作成するをご覧ください。
- 予約を作成できません。
標準プロビジョニングを使用して VM を作成しようとした場合、またはこれらのマシンタイプの予約を作成しようとした場合、エラーメッセージが返されます。

A3 Edge VM

容量をリクエストできるのは、A3 Edge マシンタイプのサポートされているプロビジョニングオプションを使用する場合のみです。
A3 Edge マシンタイプを使用する VM は、継続利用割引とフレキシブル確約利用割引の対象外となります。
A3 Edge マシンタイプは、特定のリージョンとゾーンでのみ使用できます。
A3 Edge マシンタイプを使用する VM では、リージョン Persistent Disk を使用できません。
A3 Edge マシンタイプは、Sapphire Rapids CPU プラットフォームでのみ使用できます。
既存の VM のマシンタイプを A3 Edge マシンタイプに変更することはできません。新しい A3-edge VM の作成は可能です。A3 Edge マシンタイプを使用して VM を作成した後は、マシンタイプを変更できません。
A3 Edge マシンタイプは、単一テナンシーをサポートしません。
A3 Edge マシンタイプでは Windows オペレーティングシステムを実行できません。

A2 標準 VM

容量をリクエストできるのは、A2 標準マシンタイプのサポートされているプロビジョニングオプションを使用する場合のみです。
A2 標準マシンタイプを使用する VM は、継続利用割引とフレキシブル確約利用割引の対象外となります。
A2 標準マシンタイプは、特定のリージョンとゾーンでのみ使用できます。
A2 標準マシンタイプは、Cascade Lake プラットフォームでのみ使用できます。
VM が A2 標準マシンタイプを使用している場合は、ある A2 標準マシンタイプから別の A2 標準マシンタイプにのみ切り替えることができます。他のマシンタイプには変更できません。詳細については、アクセラレータ最適化 VM を変更するをご覧ください。
<codea2-megagpu-16g< code="" dir="ltr" translate="no">A2 標準マシンタイプでは Windows オペレーティングシステムを使用できません。Windows オペレーティングシステムを使用する場合は、別の A2 標準マシンタイプを選択する必要があります。</codea2-megagpu-16g<>
A2 標準マシンタイプを使用する Windows VM では、アタッチされたローカル SSD のクイックフォーマットを行うことができません。これらのローカル SSD をフォーマットするには、diskpart ユーティリティを使用し、format fs=ntfs label=tmpfs を指定して完全フォーマットを行う必要があります。
A2 標準マシンタイプは、単一テナンシーをサポートしません。

A2 Ultra VM

容量をリクエストできるのは、A2 Ultra マシンタイプのサポートされているプロビジョニングオプションを使用する場合のみです。
A2 Ultra マシンタイプを使用する VM は、継続利用割引とフレキシブル確約利用割引の対象外となります。
A2 Ultra マシンタイプは、特定のリージョンとゾーンでのみ使用できます。
A2 Ultra マシンタイプは、Cascade Lake プラットフォームでのみ使用できます。
VM が A2 Ultra マシンタイプを使用している場合、マシンタイプを変更することはできません。別の A2 Ultra マシンタイプやその他のマシンタイプを使用するには、新しい VM を作成する必要があります。
他のマシンタイプを A2 Ultra マシンタイプに変更することはできません。A2 Ultra マシンタイプを使用する VM が必要な場合は、新しい VM を作成する必要があります。
A2 Ultra マシンタイプを使用する Windows VM では、アタッチされたローカル SSD のクイックフォーマットを行うことができません。これらのローカル SSD をフォーマットするには、diskpart ユーティリティを使用し、format fs=ntfs label=tmpfs を指定して完全フォーマットを行う必要があります。

G2 VM

容量をリクエストできるのは、G2 マシンタイプのサポートされているプロビジョニングオプションを使用する場合のみです。
G2 マシンタイプを使用する VM は、継続利用割引とフレキシブル確約利用割引の対象外となります。
G2 マシンタイプは、特定のリージョンとゾーンでのみ使用できます。
G2 マシンタイプは、Cascade Lake プラットフォームでのみ使用できます。
標準永続ディスク（pd-standard）は、G2 標準マシンタイプを使用する VM ではサポートされません。サポートされているディスクタイプについては、G2 でサポートされているディスクタイプをご覧ください。
G2 マシンタイプでマルチインスタンス GPU を作成することはできません。
G2 VM のマシンタイプを変更する必要がある場合は、アクセラレータ最適化 VM を変更するをご覧ください。
G2 マシンタイプを使用する VM のブートディスクに Deep Learning VM Image を使用することはできません。
Container-Optimized OS の現在のデフォルトドライバは、G2 マシンタイプで実行される L4 GPU をサポートしていません。Container-Optimized OS は、特定のドライバセットのみをサポートしています。G2 マシンタイプで Container-Optimized OS を使用する場合は、次の点に注意してください。
- 推奨される最小の NVIDIA ドライババージョン 525.60.13 以降をサポートする Container-Optimized OS のバージョンを使用します。詳細については、Container-Optimized OS のリリースノートをご覧ください。
- ドライバをインストールするときに、L4 GPU で動作する最新のバージョンを指定します。例: sudo cos-extensions install gpu -- -version=525.60.13。
次のシナリオでは、Google Cloud CLI または REST を使用して G2 VM を作成する必要があります。
- カスタムメモリ値を指定する必要があります。
- 表示可能な CPU コアの数をカスタマイズする必要があります。

N1+GPU VM

GPU を使用する N1 インスタンスの制限事項については、N1 マシンシリーズの機能と N1 マシンシリーズの GPU をご覧ください。

オペレーティングシステムを選択する

ML に GPU を使用している場合は、次のいずれかのオペレーティングシステムを使用します。

AI ワークロード用に最適化されたイメージ。Ubuntu イメージと Rocky イメージを使用できます。これらのイメージは、ドライバと CUDA ツールキットがプリインストールされたアクセラレータ向けの最適化バージョンで利用できます。AI Hypercomputer のドキュメントで OS イメージをご覧ください。
Deep Learning VM Image。各 Deep Learning VM には GPU ドライバのインストールツールがあり、TensorFlow や PyTorch などのパッケージが含まれています。一般的な GPU ワークロードに Deep Learning VM Image を使用することもできます。使用可能なイメージと、これらのイメージにインストールされているパッケージの詳細については、イメージの選択をご覧ください。

また、公開イメージまたはカスタムイメージを使用することもできます。一部のイメージでは、独自のドライバが必要な場合や、Compute Engine ドキュメントの範囲外のインストールプロセスが必要な場合があります。OS イメージに適したドライバを確認するには、GPU ドライバのインストールをご覧ください。

GPU 割り当てを確認する

Compute Engine システムとユーザーを保護するため、新しいプロジェクトにはグローバル GPU 割り当てが設定されます。この割り当ては、サポート対象のすべてのゾーンで作成できる GPU の総数を制限するものです。GPU の割り当てを確認するには、GPU の割り当てをご覧ください。

追加の GPU 割り当てが必要な場合は、割り当ての増加をリクエストします。GPU 割り当てをリクエストするときは、各リージョンで作成する GPU タイプに対する割り当てと、すべてのゾーンのすべての GPU タイプの合計数に対する追加のグローバル割り当てをリクエストする必要があります。

プロジェクトに確定済みのお支払い履歴がある場合、リクエストの送信後に割り当てが自動的にプロジェクトで受信されます。

GPU VM とプリエンプティブルの数量に基づく割り当て

通常、標準プロビジョニングモデルを使用する VM は、プリエンプティブルの数量に基づく割り当てを使用できません。プリエンプティブル割り当ては一時的なワークロードを対象としており、通常はより利用しやすいものです。プロジェクトにプリエンプティブル割り当てがなく、プリエンプティブル割り当てをリクエストしたことがない場合、プロジェクト内のすべての VM は標準の数量に基づく割り当てを使用します。

プリエンプティブルの数量に基づく割り当てをリクエストする場合、標準プロビジョニングモデルを使用する VM は、プリエンプティブルの数量に基づく割り当てを使用するために次のすべての条件を満たす必要があります。

VM に GPU がアタッチされている。
maxRunDuration フィールドまたは terminationTime フィールドを使用して、事前に定義された実行時間の後に VM が自動的に削除されるように構成されている。詳しくは以下をご覧ください。
- VM の実行時間を制限する
- MIG 内の VM の実行時間を制限する
VM に予約の使用が許可されていない。詳細については、コンピューティングインスタンスが予約を使用しないようにするをご覧ください。

時間制限のある GPU ワークロードにプリエンプティブル割り当てを使用すると、連続実行時間とプリエンプティブルの数量に基づく割り当ての高取得可能性の両方のメリットを享受できます。詳細については、プリエンプティブル割り当てをご覧ください。

GPU が接続された VM を作成する

GPU がアタッチされた VM を作成するには、次の操作を行います。

VM を作成します。VM の作成方法は GPU のモデルによって異なります。
- NVIDIA B200 または H200 GPU が割り当てられた VM を作成するには、A3 Ultra または A4 VM を作成するをご覧ください。
- NVIDIA H100、A100、L4 の GPU が割り当てられた VM を作成するには、A3、A2、または G2 VM を作成するをご覧ください。
- NVIDIA T4、P4、P100、V100 の GPU が割り当てられた VM を作成するには、GPU が割り当てられた N1 VM を作成するをご覧ください。
VM で GPU を使用するには、VM に GPU ドライバをインストールする必要があります。NVIDIA RTX 仮想ワークステーション（旧称 NVIDIA GRID）を有効にした場合は、仮想ワークステーション用のドライバをインストールします。

次のステップ

GPU プラットフォームの詳細を学習する。
GPU を使用する際の機能と制限事項について学習する。

GPU の実際の使用量と予測される使用量を表示する方法を学習する。