アクセラレータ最適化マシン ファミリー


アクセラレータ最適化マシン ファミリーは、Google Cloud が設計し、人工知能(AI)、機械学習(ML)、ハイ パフォーマンス コンピューティング(HPC)などの GPU 高速化ワークロードに必要なパフォーマンスと効率性を実現しています。

アクセラレータ最適化マシン ファミリーは、A2 標準マシンタイプと ultra マシンタイプ、G2 標準マシンタイプで使用できます。アクセラレータ最適化マシンタイプには、それぞれ特定のモデルと数の NVIDIA GPU がアタッチされています。N1 汎用マシンタイプに一部の GPU モデルをアタッチすることもできます。

ワークロード タイプ別のマシンシリーズの推奨事項

次のセクションでは、GPU ワークロードに基づいて推奨されるマシンシリーズについて説明します。

大規模な AI モデル

ワークロード タイプ 適した事例
複数(分散)サーバー トレーニング A2
推論 A2

メインストリーム モデル

ワークロード タイプ 適した事例適切な代替手段
複数(分散)サーバー トレーニング A2
  • G2
  • N1+V100
単一サーバー トレーニング A2
  • G2
  • N1+V100
推論 G2
  • N1+T4
  • N1+V100

グラフィックを多用するワークロード

ワークロード タイプ 適した事例
動画ストリーミングとコード変換、リモート仮想ワークステーション、デジタルツイン
  • G2
  • N1+T4

ハイ パフォーマンス コンピューティング

ハイ パフォーマンス コンピューティングのワークロードでは、アクセラレータ最適化マシンシリーズが適しています。最適なものは、GPU にオフロードする必要がある計算量によって異なります。

料金と割引

アクセラレータ最適化マシンタイプはすべて、次の割引と使用量のオプションをサポートしています。

アクセラレータ最適化マシンタイプは、アタッチされている GPU、事前定義された vCPU、メモリ、バンドルされたローカル SSD(該当する場合)に対して課金されます。アクセラレータ最適化 VM の料金の詳細については、VM インスタンスの料金ページのアクセラレータ最適化マシンタイプ ファミリーのセクションをご覧ください。

A2 マシンシリーズ

A2 マシンシリーズは、A2 標準マシンタイプと A2 Ultra マシンタイプで使用できます。これらのマシンタイプには、12~96 個の vCPU と最大 1,360 GB のメモリがあります。

A2 マシンシリーズには、次の機能もあります。

  • NVIDIA GPU アタッチ: 各 A2 マシンタイプには NVIDIA A100 GPU があります。これらは、A100 40 GB と A100 80 GB の両方のオプションで利用できます。

  • 業界トップクラスの NVLink スケーリング。GPU 間で 600 GBps のピーク NVLink 帯域幅を実現します。たとえば、16 個の GPU を使用するシステムの場合、NVLink の帯域幅は合計で 9.6 TBps までとなります。これらの 16 個の GPU は、統合されたメモリ領域を備えた 1 つのハイ パフォーマンスなアクセラレータとして使用できます。これにより、最大 10 PFLOPS のコンピューティング能力と、最大 20 PFLOPS の推論コンピューティング能力を実現し、AI、ディープ ラーニング、ML のワークロードを対象として使用できます。

  • 改善したコンピューティング速度: アタッチされた NVIDIA A100 GPU は、前世代の NVIDIA V100 GPU と比較して、コンピューティング速度が最大 10 倍向上しています。

    A2 マシンシリーズでは、最大 100 Gbps のネットワーク帯域幅を使用できます。

  • ストレージ: 高速のスクラッチ ディスクの場合や、I/O ボトルネックを防止しながら GPU にデータをフィードする場合、A2 マシンタイプは次のようにローカル SSD をサポートします。

    • A2 標準マシンタイプの場合、最大 3 TB のローカル SSD を追加できます。
    • A2 Ultra マシンタイプの場合、VM の作成時にローカル SSD が自動的にアタッチされます。

    この高いストレージ パフォーマンスを必要とするアプリケーションの場合は、最大 257 TB の永続ディスク ストレージを A2 VM にアタッチすることもできます。

  • コンパクト プレースメント ポリシーのサポート: データセンター内の VM の物理的な配置をより細かく制御できます。これにより、単一のアベイラビリティ ゾーン内で VM を配置するために、低レイテンシと広帯域幅を実現できます。詳しくは、コンパクト プレースメント ポリシーを使用してレイテンシを短縮するをご覧ください。

A2 でサポートされているディスクタイプ

A2 VM は、次のブロック ストレージ タイプを使用できます。

  • バランス Persistent Disk(pd-balanced
  • SSD(パフォーマンス)Persistent Disk(pd-ssd
  • 標準 Persistent Disk(pd-standard
  • ローカル SSD: A2 ultra マシンタイプを使用して作成された VM に自動的にアタッチされます。

A2 標準マシンタイプ

これらのマシンタイプには、固定数の A100 40 GB GPU があります。

マシンタイプ GPU 数 vCPU* メモリ(GB) Persistent Disk(PD)の最大数 PD の最大合計サイズ(TB) ローカル SSD 最大下り(外向き)帯域幅(Gbps)
a2-highgpu-1g 1 12 85 128 257 24
a2-highgpu-2g 2 24 170 128 257 32
a2-highgpu-4g 4 48 340 128 257 50
a2-highgpu-8g 8 96 680 128 257 100
a2-megagpu-16g 16 96 1360 128 257 100

* vCPU は、利用可能な CPU プラットフォームのいずれかで単一のハードウェア ハイパースレッドとして実装されます。
永続ディスクの使用量は、マシンタイプ別の料金体系とは別に課金されます。
最大下り(外向き)帯域幅は許容数を超えることはできません。実際の下り(外向き)帯域幅は、宛先 IP アドレスやその他の要因によって異なります。ネットワーク帯域幅をご覧ください。

A2 標準の制限事項

  • A2 標準マシンタイプを使用する VM は継続利用割引を受けることができません。
  • A2 標準マシンタイプは、特定のリージョンとゾーンでのみ使用できます。
  • A2 標準マシンタイプは、Cascade Lake プラットフォームでのみ使用できます。
  • A2 標準マシンタイプを使用する VM では、リージョン永続ディスクを使用できません。
  • a2-megagpu-16g A2 標準マシンタイプは Windows オペレーティング システムでは使用できません。Windows オペレーティング システムを使用する場合は、別の A2 標準マシンタイプを選択します。
  • A2 標準マシンタイプを使用する Windows VM では、アタッチされたローカル SSD をクイック フォーマットできません。これらのローカル SSD をフォーマットするには、diskpart ユーティリティを使用し、format fs=ntfs label=tmpfs を指定して、完全フォーマットする必要があります。

A2 Ultra マシンタイプ

これらのマシンタイプには、固定数の A100 80 GB GPU があります。ローカル SSD は、A2 ultra マシンタイプを使用して作成された VM に自動的にアタッチされます。

マシンタイプ GPU 数 vCPU* メモリ(GB) Persistent Disk(PD)の最大数 PD の最大合計サイズ(TB) バンドルされたローカル SSD 最大下り(外向き)帯域幅(Gbps)
a2-ultragpu-1g 1 12 170 128 257 375 GB 24
a2-ultragpu-2g 2 24 340 128 257 750 GB 32
a2-ultragpu-4g 4 48 680 128 257 1.5 TB 50
a2-ultragpu-8g 8 96 1360 128 257 3 TB 100

* vCPU は、利用可能な CPU プラットフォームのいずれかで単一のハードウェア ハイパースレッドとして実装されます。
永続ディスクの使用量は、マシンタイプ別の料金体系とは別に課金されます。
最大下り(外向き)帯域幅は許容数を超えることはできません。実際の下り(外向き)帯域幅は、宛先 IP アドレスやその他の要因によって異なります。ネットワーク帯域幅をご覧ください。

A2 Ultra の制限事項

  • A2 Ultra マシンタイプを使用する VM は継続利用割引を受けることができません。
  • A2 Ultra マシンタイプは、特定のリージョンとゾーンでのみ使用できます。
  • A2 Ultra マシンタイプは、Cascade Lake プラットフォームでのみ使用できます。
  • A2 Ultra マシンタイプを使用する VM では、リージョン永続ディスクを使用できません。
  • A2 Ultra マシンタイプを使用する Windows VM では、アタッチされたローカル SSD をクイック フォーマットできません。これらのローカル SSD をフォーマットするには、diskpart ユーティリティを使用し、format fs=ntfs label=tmpfs を指定して、完全フォーマットする必要があります。
  • A2 Ultra マシン ファミリーを使用する VM のマシンタイプは変更できません。別の A2 Ultra マシンタイプやその他のマシン ファミリーを使用する必要がある場合は、新しい VM を作成する必要があります。
  • 他のマシンタイプを A2 Ultra マシンタイプに変更することはできません。A2 Ultra マシンタイプを使用する VM を作成する必要がある場合は、新しい VM を作成する必要があります。

G2 マシンシリーズ

G2 マシンシリーズは、4~96 個の vCPU と最大 432 GB のメモリを備えた標準マシンタイプで使用できます。このマシンシリーズは、推論ワークロードとグラフィック ワークロード用に最適化されています。

G2 マシンシリーズには、次の機能もあります。

  • NVIDIA GPU アタッチ: 各 G2 マシンタイプには NVIDIA L4 GPU が搭載されています。

  • 推論レートの改善: G2 マシンタイプは、ML 推論レートを高速化してメモリ要件を減らす FP8(8 ビット浮動小数点)データ型をサポートしています。

  • 次世代のグラフィックス パフォーマンス: NVIDIA L4 GPU は、第 3 世代の RT コアおよび NVIDIA DLSS 3(ディープ ラーニング スーパー サンプリング)テクノロジー使用することで、グラフィックス パフォーマンスが最大 3 倍向上します。

  • 高パフォーマンスのネットワーク帯域幅: G2 マシンシリーズでは、最大 100 Gbps のネットワーク帯域幅を使用できます。

  • ストレージ: G2 VM には最大 3 TB のローカル SSD を追加できます。これは、高速のスクラッチ ディスクの場合や、I/O ボトルネックを防止しながらデータを GPU にフィードする場合に使用できます。

    この高いストレージ パフォーマンスを必要とするアプリケーションの場合は、G2 VM に最大 257 TB の Persistent Disk ストレージをアタッチすることもできます。

  • コンパクト プレースメント ポリシーのサポート: データセンター内の VM の物理的な配置をより細かく制御できます。これにより、単一のアベイラビリティ ゾーン内で VM を配置するために、低レイテンシと広帯域幅を実現できます。詳しくは、コンパクト プレースメント ポリシーを使用してレイテンシを短縮するをご覧ください。

G2 でサポートされているディスクタイプ

G2 VM では、次のブロック ストレージ タイプを使用できます。

  • バランス Persistent Disk(pd-balanced
  • SSD(パフォーマンス)Persistent Disk(pd-ssd
  • ローカル SSD

G2 標準マシンタイプ

各 G2 マシンタイプには、固定数の NVIDIA L4 GPU と vCPU がアタッチされます。各 G2 マシンタイプにはデフォルトのメモリとカスタムメモリ範囲もあります。カスタムメモリ範囲はマシンタイプごとに VM に割り当てることができるメモリの量を定義します。カスタムメモリは VM の作成時に指定できます。

マシンタイプ GPU 数 vCPU* デフォルトのメモリ(GB) カスタムメモリ範囲(GB) Persistent Disk(PD)の最大数 PD の最大合計サイズ(TB) 最大ローカル SSD サポート(GB) 最大下り(外向き)帯域幅(Gbps)
g2-standard-4 1 4 16 16 - 32 128 257 375 10
g2-standard-8 1 8 32 32 - 54 128 257 375 16
g2-standard-12 1 12 48 48 - 54 128 257 375 16
g2-standard-16 1 16 64 54 - 64 128 257 375 32
g2-standard-24 2 24 96 96 - 108 128 257 750 32
g2-standard-32 1 32 128 96 - 128 128 257 375 32
g2-standard-48 4 48 192 192 - 216 128 257 1500 50
g2-standard-96 8 96 384 384 - 432 128 257 3000 100

* vCPU は、利用可能な CPU プラットフォームのいずれかで単一のハードウェア ハイパースレッドとして実装されます。
永続ディスクの使用量は、マシンタイプ別の料金体系とは別に課金されます。
最大下り(外向き)帯域幅は許容数を超えることはできません。実際の下り(外向き)帯域幅は、宛先 IP アドレスやその他の要因によって異なります。ネットワーク帯域幅をご覧ください。

G2 標準の制限事項

  • G2 標準マシンタイプを使用する VM は継続利用割引を受けることができません。
  • G2 標準マシンタイプは、特定のリージョンとゾーンでのみ使用できます。
  • G2 標準マシンタイプは、Cascade Lake プラットフォームでのみ使用できます。
  • G2 標準マシンタイプを使用する VM では、リージョン永続ディスクを使用できません。
  • 標準永続ディスク(pd-standard)は、G2 標準マシンタイプを使用する VM ではサポートされません。サポートされているディスクタイプについては、G2 でサポートされているディスクタイプをご覧ください。
  • G2 標準マシンタイプでマルチインスタンス GPU を作成することはできません。
  • G2 標準マシンタイプを使用する VM のブートディスクとして Deep Learning VM Image は使用できません。
  • Container-Optimized OS の現在のデフォルト ドライバは、G2 マシンタイプで実行される L4 GPU をサポートしていません。Container-Optimized OS は、特定のドライバセットのみをサポートしています。G2 マシンタイプで Container-Optimized OS を使用する場合は、次の点に注意してください。
    • 推奨される最小の NVIDIA ドライバ バージョン 525.60.13 以降をサポートする Container-Optimized OS のバージョンを使用します。詳細については、Container-Optimized OS のリリースノートをご覧ください。
    • ドライバをインストールするときに、L4 GPU で動作する最新のバージョンを指定します。例: sudo cos-extensions install gpu -- -version=525.60.13
  • 次のシナリオでは、Google Cloud CLI または Compute Engine API を使用して G2 VM を作成する必要があります。
    • カスタムメモリ値を指定する必要があります。
    • 表示可能な CPU コアの数をカスタマイズする必要があります。

次のステップ