本頁面由 Cloud Translation API 翻譯而成。

建立附加 GPU 的執行個體總覽

Linux Windows

本文概要說明建立 Compute Engine 執行個體並附加圖形處理器 (GPU) 的步驟。您可以使用 GPU 加速處理特定工作負載，例如機器學習和資料處理。

您也可以在 AI Hypercomputer 上使用部分 GPU 機器類型。AI Hypercomputer 是一套超級電腦系統，經過最佳化處理，可支援人工智慧 (AI) 和機器學習 (ML) 工作負載。建議您使用這個選項建立密集分配的基礎架構，並整合 Google Kubernetes Engine (GKE) 和 Slurm 排程器，以達到最佳效能。

如要進一步瞭解 Compute Engine 上的 GPU，請參閱「關於 GPU」一文。

選取 GPU 型號

如需可用 GPU 型號的清單，請參閱 GPU 平台。此外，請記下所選 GPU 型號支援的機器類型。

建議您也查看下列各項模型：

支援的地區和區域。
請參閱 GPU 定價，瞭解在執行個體中使用各 GPU 型號的費用。如為使用加速器最佳化機器的執行個體，請一併查看 VM 執行個體定價。

限制

除了所有搭載 GPU 的執行個體限制外，每個附加 GPU 的機器系列都有下列限制：

A4X 執行個體

您只能透過 A4X 機器類型支援的用量選項要求容量。
使用 A4X 機器類型的執行個體不適用續用折扣和彈性承諾使用折扣。
A4X 機器類型僅適用於特定區域和可用區。
如果執行個體使用 A4X 機器類型，就無法使用永久磁碟 (區域或可用區)。
A4X 機器類型僅適用於 NVIDIA Grace 平台。
注意：Compute Engine 服務水準協議 (SLA) 不適用於 A4X 系列機器。
您無法將現有執行個體的機器類型變更為 A4X 機器類型。您只能建立新的 A4X 執行個體。使用 A4X 機器類型建立執行個體後，就無法變更機器類型。
您無法在 A4X 機型上執行 Windows 作業系統。
A4X 執行個體不支援下列項目：

A4 執行個體

您只能使用 A4 機器類型的支援用量選項來要求容量。
使用 A4 機器類型的執行個體不適用續用折扣和彈性承諾使用折扣。
A4 機器類型僅適用於特定區域和可用區。
如果執行個體使用 A4 機器類型，就無法使用永久磁碟 (區域或可用區)。
A4 機器類型僅適用於 Emerald Rapids CPU 平台。
您無法將現有執行個體的機器類型變更為 A4 機器類型。您只能建立新的 A4 執行個體。使用 A4 機器類型建立執行個體後，就無法變更機器類型。
A4 機器類型不支援單一租戶。
您無法在 A4 機器類型上執行 Windows 作業系統。

A3 Ultra 執行個體

您只能使用 A3 Ultra 機型的支援用量選項要求容量。
使用 A3 Ultra 機器類型的執行個體不適用續用折扣和彈性承諾使用折扣。
A3 Ultra 機器類型僅適用於特定區域和可用區。
如果執行個體使用 A3 Ultra 機器類型，就無法使用永久磁碟 (區域或可用區)。
A3 Ultra 機器類型僅適用於 Emerald Rapids CPU 平台。
您無法將現有執行個體的機器類型變更為 A3 Ultra 機器類型。您只能建立新的 A3-ultra 執行個體。使用 A3 Ultra 機型建立執行個體後，就無法變更機型。
A3 Ultra 機型不支援單一租戶。
您無法在 A3 Ultra 機型上執行 Windows 作業系統。

A3 Mega 執行個體

您只能透過 A3 Mega 機型支援的用量選項要求容量。
使用 A3 Mega 機器類型的執行個體不適用續用折扣和彈性承諾使用折扣。
您只能在特定區域和可用區使用 A3 Mega 機器類型。
如果執行個體使用 A3 Mega 機型，就無法使用區域永久磁碟。
A3 Mega 機器類型僅適用於 Sapphire Rapids CPU 平台。
您無法將現有執行個體的機器類型變更為 A3 Mega 機器類型。您只能建立新的 A3-mega 執行個體。使用 A3 Mega 機器類型建立執行個體後，就無法變更機器類型。
A3 Mega 機型不支援單一租戶。
您無法在 A3 Mega 機器類型上執行 Windows 作業系統。

A3 High 執行個體

您只能透過 A3 High 機型支援的用量選項要求容量。
使用 A3 High 機器類型的執行個體不適用續用折扣和彈性承諾使用折扣。
您只能在特定區域和可用區使用 A3 High 機型。
您無法在採用 A3 High 機型的執行個體上使用區域永久磁碟。
A3 High 機型僅適用於 Sapphire Rapids CPU 平台。
您無法將現有執行個體的機器類型變更為 A3 High 機器類型。您只能建立新的 A3 高階執行個體。使用 A3 High 機器類型建立執行個體後，就無法變更機器類型。
A3 High 機型不支援單一用戶群。
您無法在 A3 High 機型上執行 Windows 作業系統。
如要使用 a3-highgpu-1g、a3-highgpu-2g 和 a3-highgpu-4g 機器類型，請使用 Spot VM 或彈性啟動 VM 建立執行個體。如需這些選項的詳細操作說明，請參閱下列文章：
- 如要建立 Spot VM，請在建立加速器最佳化 VM 時，將佈建模式設為 SPOT。
- 如要建立彈性啟動 VM，請使用下列其中一種方法：
  - 建立獨立 VM，並在建立加速器最佳化 VM 時，將佈建模式設為 FLEX_START。
  - 在代管執行個體群組 (MIG) 中建立規模調整要求。如需操作說明，請參閱建立含 GPU VM 的 MIG。
您只能在有限的區域和可用區，使用 a3-highgpu-1g 機器類型搭配機密 VM，且所有在 A3 High 機器類型上執行機密 VM 的限制都適用。

A3 Edge 執行個體

您只能透過 A3 Edge 機器類型支援的用量選項要求容量。
使用 A3 Edge 機型執行個體時，您無法享有續用折扣和彈性承諾使用折扣。
您只能在特定區域和可用區使用 A3 Edge 機器類型。
使用 A3 Edge 機器類型的執行個體無法使用區域性永久磁碟。
A3 Edge 機器類型僅適用於 Sapphire Rapids CPU 平台。
您無法將現有執行個體的機器類型變更為 A3 Edge 機器類型。您只能建立新的 A3-edge 執行個體。使用 A3 Edge 機器類型建立執行個體後，就無法變更機器類型。
A3 Edge 機器類型不支援單一租戶。
您無法在 A3 Edge 機器類型上執行 Windows 作業系統。

A2 Standard 執行個體

您只能透過 A2 Standard 機型支援的用量選項要求容量。
使用 A2 Standard 機器類型的執行個體不適用續用折扣和彈性承諾使用折扣。
您只能在特定區域和可用區使用 A2 Standard 機器類型。
A2 Standard 機器類型僅適用於 Cascade Lake 平台。
如果執行個體使用 A2 Standard 機型，只能從一種 A2 Standard 機型切換至另一種 A2 Standard 機型。您無法變更為任何其他機器類型。詳情請參閱「修改已最佳化加速器的執行個體」。
您無法在 a2-megagpu-16g A2 Standard 機型上使用 Windows 作業系統。使用 Windows 作業系統時，請選擇其他 A2 Standard 機型。
在採用 A2 Standard 機型的 Windows 執行個體上，您無法快速格式化所連線的本機 SSD。如要格式化這些本機 SSD，請使用 diskpart 公用程式並指定 format fs=ntfs label=tmpfs，執行完整格式化。
A2 Standard 機型不支援單一租戶。

A2 Ultra 執行個體

您只能使用 A2 Ultra 機型的支援用量選項要求容量。
使用 A2 Ultra 機器類型的執行個體不適用續用折扣和彈性承諾使用折扣。
您只能在特定區域和可用區使用 A2 Ultra 機器類型。
A2 Ultra 機型僅適用於 Cascade Lake 平台。
如果執行個體使用 A2 Ultra 機器類型，就無法變更機器類型。如要使用其他 A2 Ultra 機型或其他機型，請建立新的執行個體。
您無法將任何其他機器類型變更為 A2 Ultra 機器類型。如需使用 A2 Ultra 機器類型的執行個體，請建立新的執行個體。
如果 Windows 執行個體使用 A2 Ultra 機器類型，您就無法快速格式化所連線的本機 SSD。如要格式化這些本機 SSD，請使用 diskpart 公用程式並指定 format fs=ntfs label=tmpfs，執行完整格式化。

G4 執行個體

您只能透過 G4 機器類型支援的用量選項要求容量。
使用 G4 機器類型的執行個體不適用續用折扣和彈性承諾使用折扣。
您只能在特定區域和可用區使用 G4 機器類型。
您無法在採用 G4 機器類型的執行個體上使用永久磁碟 (區域或可用區)。
G4 機器類型僅適用於 AMD EPYC Turin 第 5 代平台。
您只能建立隨選執行個體。系統不支援預留項目、彈性啟動 VM 或 Spot VM。如要開始使用 G4 執行個體，請與 Google 帳戶團隊聯絡。
您只能在 us-central1-b 中建立 G4 執行個體。
只有使用 G4 機器類型的執行個體，才能使用 Hyperdisk Balanced 和 Hyperdisk Extreme 磁碟類型。
使用 G4 機器類型的執行個體無法套用承諾使用折扣。
您無法建立使用 G4 機型的機密 VM 執行個體。
您無法在單一用戶群節點上建立 G4 執行個體。
您無法建立使用 NVIDIA RTX 虛擬工作站 (vWS) 的 G4 執行個體。

G2 執行個體

您只能使用 G2 機器類型的支援用量選項來要求容量。
使用 G2 機器類型的執行個體不適用續用折扣和彈性承諾使用折扣。
G2 機器類型僅適用於特定區域和可用區。
G2 機器類型僅適用於 Cascade Lake 平台。
使用 G2 機器類型的執行個體不支援標準永久磁碟 (pd-standard)。如要瞭解支援的磁碟類型，請參閱「G2 支援的磁碟類型」。
您無法在採用 G2 機器類型的執行個體上建立多重執行個體 GPU。
如要變更 G2 執行個體的機器類型，請參閱「修改加速器最佳化執行個體」。
如果執行個體使用 G2 機器類型，您就無法將深度學習 VM 映像檔做為開機磁碟。
Container-Optimized OS 目前的預設驅動程式不支援在 G2 機型上執行的 L4 GPU。此外，Container-Optimized OS 僅支援特定驅動程式集。如要在 G2 機器類型上使用 Container-Optimized OS，請參閱下列注意事項：
- 使用支援最低建議 NVIDIA 驅動程式版本 525.60.13 以上的 Container-Optimized OS 版本。詳情請參閱 Container-Optimized OS 版本資訊。
- 安裝驅動程式時，請指定適用於 L4 GPU 的最新版本。例如：sudo cos-extensions install gpu -- -version=525.60.13。
您必須使用 Google Cloud CLI 或 REST，才能在下列情境中建立 G2 執行個體：
- 您想指定自訂記憶體值。
- 您想自訂可見的 CPU 核心數量。

N1+GPU 執行個體

如要瞭解搭載 GPU 的 N1 執行個體限制，請參閱 N1 機器系列的功能和 N1 機器系列的 GPU。

選擇作業系統

如果您要使用 GPU 進行機器學習，請使用下列其中一種作業系統：

針對 AI 工作負載最佳化的映像檔。您可以使用 Ubuntu 和 Rocky 映像檔，這些映像檔提供經過加速器最佳化的版本，並預先安裝 NVIDIA 驅動程式和 CUDA 工具包。請參閱 AI Hypercomputer 說明文件中的「OS images」。
深度學習 VM 映像檔。每個深度學習 VM 都具備 GPU 驅動程式安裝工具，並包含 TensorFlow 和 PyTorch 等套件。您也可以將深度學習 VM 用於一般 GPU 工作負載。如要進一步瞭解可用的映像檔，以及這些映像檔上安裝的套件，請參閱深層學習 VM 說明文件中的「選擇映像檔」。

注意：您無法在採用 G2 機器類型的 VM 開機磁碟上使用深度學習 VM 映像檔。G2 機型是加速器最佳化機型系列，連接的是 NVIDIA L4 GPU。

或者，您也可以使用公開或自訂映像檔。對於大多數公開映像檔或自訂映像檔，您需要安裝 NVIDIA 驅動程式和 CUDA Toolkit。如要瞭解適合 GPU 型號的驅動程式，請參閱「安裝 GPU 驅動程式」。

查看 GPU 配額

為保護 Compute Engine 系統和使用者，新專案有全域 GPU 配額，這會限制您可在任何支援區域中建立的 GPU 總數。如要查看 GPU 配額，請參閱「GPU 配額」一文。

如果需要更多 GPU 配額，請參閱申請提高配額的相關說明。要求 GPU 配額時，您必須為要在各個地區建立的 GPU 類型要求配額，並依據所有區域中各類 GPU 的總數要求額外的全域配額。

如果您的專案已建立帳單記錄，那麼當您提交要求之後，專案就會自動獲得配額。

GPU 執行個體和先占分配配額

使用標準佈建模式的執行個體通常無法使用先占分配配額。先占配額適用於臨時工作負載，通常較容易取得。如果專案沒有先占配額，且您從未要求先占配額，則專案中的所有執行個體都會消耗標準分配配額。

如果您要求搶占式配置配額，則使用標準佈建模型的執行個體必須符合下列所有條件，才能消耗搶占式配置配額：

執行個體已附加 GPU。
系統會透過 maxRunDuration 或 terminationTime 欄位，將執行個體設定為在預先定義的執行時間後自動刪除。詳情請參閱下列說明：
- 限制執行個體的執行時間
- 限制 MIG 中執行個體的執行時間
執行個體不得使用預留項目。詳情請參閱「禁止運算執行個體使用預留項目」。

為有時間限制的 GPU 工作負載使用先占分配量時，您可享有不間斷的執行時間，以及先占分配量配額的高取得率。詳情請參閱「先佔配額」。