Compute Engine の GPU

Google Compute Engine は、仮想マシン インスタンスに追加できるグラフィック プロセッシング ユニット(GPU)を備えています。これらの GPU を使用して、インスタンスで実行される機械学習やデータ処理などの特定のワークロードを高速化できます。

インスタンスに GPU を追加する方法については、インスタンスへの GPU の追加をご覧ください。

はじめに

Compute Engine では、NVIDIA® Tesla® P100 および K80 GPU がパススルー モードでインスタンスに提供されており、仮想マシン インスタンスが GPU とその関連メモリを直接制御できるようになっています。

各 GPU モデルは次の段階で利用できます。

  • NVIDIA® Tesla® P100: ベータ版
  • NVIDIA® Tesla® K80: 一般提供

ベータ版でリリースされる GPU モデルは、サービスレベル契約(SLA)または非推奨ポリシーの対象ではなく、バージョンアップ時に下位互換性が維持されない可能性があります。さらに、ベータ版でリリースされる GPU モデルは、必ずしもローカル SSD などの他の Compute Engine 機能と組み合わせて利用できるとは限りません。

GPU を追加できるマシンタイプは、ある特定のゾーンに作成可能で、かつ共有コアタイプでない事前定義されたマシンタイプまたはカスタム マシンタイプです。ただし、GPU 数が少ないインスタンスの場合は、vCPU およびシステムメモリの最大数に制限されます。一般的に、GPU の数が多いほど、より多くの vCPU 数とシステムメモリを持つインスタンスを作成できます。asia-east1-a ゾーンと us-east1-d ゾーンでは、最大 416 GB のメモリを持つ GPU インスタンスを作成できます。これら以外のゾーンでは、GPU インスタンスのシステムメモリは最大 208 GB に制限されます。

GPU モデル GPU GPU ボード GPU メモリ 利用可能な vCPU 数 利用可能なメモリ 利用可能なゾーン
NVIDIA® Tesla® P100 1 GPU 1 ボード 16 GB HBM2 1~16 vCPU 1~104 GB
  • us-west1-b
  • us-central1-c
  • us-central1-f
  • us-east1-c
  • europe-west1-b
  • europe-west1-d
  • asia-east1-a
2 GPU 2 ボード 32 GB HBM2 1~32 vCPU 1~208 GB
4 GPU 4 ボード 64 GB HBM2 1~64 vCPU 1~208 GB
NVIDIA® Tesla® K80 1 GPU 1/2 ボード 12 GB GDDR5 1~8 vCPU 1~52 GB
  • us-west1-b
  • us-central1-c
  • us-east1-c
  • us-east1-d
  • europe-west1-b
  • europe-west1-d
  • asia-east1-a
  • asia-east1-b
2 GPU 1 ボード 24 GB GDDR5 1~16 vCPU 1~104 GB
4 GPU 2 ボード 48 GB GDDR5 1~32 vCPU 1~208 GB
8 GPU 4 ボード 96 GB GDDR5 1~64 vCPU

1〜416 GB(asia-east1-a と us-east1-d)

1~208 GB(その他すべてのゾーン)

GPU デバイスには、vCPU と同様の継続利用割引が適用されます。GPU デバイスの時間単位の料金や月単位の料金については、Compute Engine の料金のページをご覧ください。

プリエンプティブ インスタンスの GPU

より安価なプリエンプティブ料金GPU をプリエンプティブ VM インスタンスに追加できます。プリエンプティブ インスタンスに接続された GPU は、通常の GPU と同様に動作しますが、インスタンスの存続期間中にのみ有効になります。GPU をプリエンプティブ インスタンスに追加した場合、GPU 割り当ては通常の割り当て量になります。プリエンプティブ GPU 用の割り当てが別途必要な場合は、プリエンプティブ GPU 割り当てを別途リクエストしてください。

メンテナンス イベント中には、GPU を使用したプリエンプティブ インスタンスはデフォルトでプリエンプトされ、自動的に再起動することはできません。プリエンプトされたインスタンスを再作成する場合は、マネージド インスタンス グループを使用します。マネージド インスタンス グループは、vCPU、メモリ、および GPU リソースが利用可能であれば、インスタンスを再作成します。

インスタンスがプリエンプトされる前に警告を受けるようにする場合、またはメンテナンス イベントの終了後にインスタンスが自動的に再起動するように設定する場合は、GPU を使用した非プリエンプティブ インスタンスを使用します。GPU を使用した非プリエンプティブ インスタンスの場合は、Google からプリエンプションの 1 時間前に通知が送信されます。

非プリエンプティブ インスタンスを自動的に再起動する手順については、インスタンスのオプションの更新をご覧ください。

GPU が接続されたプリエンプティブ インスタンスの作成方法については、GPU を使用したインスタンスの作成をご覧ください。

制限事項

GPU を使用するインスタンスには固有の制約があり、他のインスタンス タイプとは異なる動作をします。

  • GPU デバイスは、Broadwell CPU プラットフォームと最大 64 個の vCPU を持つインスタンスにのみ接続できます。

  • asia-east1-a ゾーンと us-east1-d ゾーンでは、GPU インスタンスは最大 416 GB のメモリに制限されます。これら以外のゾーンでは、GPU インスタンスのシステムメモリは最大 208 GB に制限されます。

  • GPU インスタンスはホスト メンテナンス イベントの際に終了する必要がありますが、自動的に再起動できます。これらのメンテナンス イベントは、通常、週に 1 回実行しますが、必要に応じて頻繁に実行することもできます。これらのメンテナンス イベントが適正に処理されるようにワークロードを構成する必要があります。具体的には、機械学習や高性能コンピューティング(HPC)などの長時間実行されるワークロードでは、ホスト メンテナンス イベントの中断を処理する必要があります。GPU を使用したインスタンスでのホスト メンテナンス イベントの処理方法をご覧ください。

  • GPU を使用するインスタンスを作成するには、その前に GPU を割り当てる必要があります。割り当てページで、十分な GPU がプロジェクトで使用可能かどうかを確認し、必要に応じて割り当ての増加をリクエストしてください。新規プロジェクトと無料トライアル アカウントには、デフォルトで GPU の割り当てはありません。

  • GPU を使用するインスタンスでは、インスタンスに追加する GPU ごとに vCPU の最大数が決まっています。たとえば、各 NVIDIA® Tesla® K80 GPU では、インスタンスのマシンタイプで最大 8 個の vCPU と最大 52 GB のシステムメモリを使用できます。各種 GPU 構成で使用可能な vCPU とメモリの範囲を確認するには、GPU リストをご覧ください。

  • 共有コア マシンタイプのインスタンスに GPU を接続することはできません。

  • GPU が正しく機能するにはデバイス ドライバが必要です。Google Compute Engine で動作する NVIDIA GPU には、次のバージョンのドライバを使用する必要があります。

    • Linux インスタンス:
      • R384 ブランチ: NVIDIA 384.111 以上のドライバ
      • R390 ブランチ: まだ使用できません
    • Windows Server インスタンス:
      • R384 ブランチ: NVIDIA 386.07 以上のドライバ
      • R390 ブランチ: まだ使用できません
  • 特定の接続済み GPU モデルを使用するインスタンスは、その接続された GPU モデルが、インスタンスが配置されているのと同じリージョンの複数のゾーンで使用できる場合にのみ、Google Compute Engine SLA の対象となります。次のゾーンでは、特定の GPU モデルが Google Compute Engine SLA の対象外となります。

    • NVIDIA® Tesla® P100:
      • どのゾーンにおいても、ベータ版は SLA なしでリリースされています。
    • NVIDIA® Tesla® K80:
      • us-west1-b
      • us-central1-c
  • europe-west1-d で NVIDIA® Tesla® P100 GPU を使用するインスタンスは、ローカル SSD デバイスを使用できません。

次のステップ

このページは役立ちましたか?評価をお願いいたします。

フィードバックを送信...

Compute Engine ドキュメント