Compute Engine 執行個體的佈建模型


本文說明 Compute Engine 執行個體的佈建模型。如要進一步瞭解部署選項,請參閱「為工作負載選擇 Compute Engine 部署策略」。

佈建模型會決定執行個體的可用性、生命週期和價格。瞭解這些模型後,就能為工作負載選擇最佳選項。

可用的佈建模型

建立運算執行個體時,可以指定下列其中一種佈建模型。如未指定佈建模型,Compute Engine 預設會使用標準佈建模型。

  • 標準

  • Spot

  • 彈性啟動 (預覽版)

  • 取決於預留項目

下表列出各佈建模式的用途和價格比較:

標準 Spot 彈性啟動 (預覽版) 取決於預留項目
摘要
  • 您可以根據資源可用性立即建立執行個體。
  • 您可以控管停止或刪除執行個體的時間。
  • 您可以根據資源可用性立即建立執行個體。
  • 您可以控管何時停止或刪除執行個體。不過,您也可以允許 Compute Engine 隨時停止或刪除執行個體,以回收容量。
  • 建立區域代管執行個體群組 (MIG) 後,請要求 Compute Engine 將附加 GPU 的執行個體新增至 MIG。Compute Engine 會根據資源可用性,排定執行個體的佈建時間。
  • 您可以控管執行個體的刪除時間。不過,您無法停止、暫停或重新建立這些執行個體。執行個體最多可運作七天。 接著,Compute Engine 會刪除這些項目。
  • 您可以要求在未來日期預留容量,以便建立附加 GPU 的執行個體。如果 Google Cloud 核准您的要求,Compute Engine 就會建立預訂。在預留期間開始時,您可以建立與預留項目相符的 GPU 執行個體,藉此使用預留項目。
  • 在核准的預訂期間,您可以停止、重新啟動、刪除及重新建立執行個體,視需要使用預訂資源。預留項目期限結束時,Compute Engine 會刪除預留項目,並停止或刪除使用預留項目的執行個體。
用途 適合需要穩定性和持續運作的工作負載,例如:
  • 網路伺服器
  • 資料庫
  • 企業應用程式
  • 開發與測試
適合用於可容許中斷的工作負載,例如下列工作負載:
  • 批次處理
  • 高效能運算 (HPC)
  • 持續整合和持續部署 (CI/CD)
  • 資料分析
  • 媒體編碼
  • 線上推論
需要穩定性且執行時間不超過七天的工作負載,例如:
  • 小型模型預先訓練
  • 模型微調
  • HPC 模擬
  • 批次推論
適合需要穩定性和特定執行時間的工作負載,例如:
  • 工作負載最多可持續 90 天
    • 模型預先訓練工作
    • 模型微調工作
    • HPC 模擬工作負載
    • 短期內推論工作負載預期會增加
  • 工作負載超過 90 天
    • 訓練工作負載
    • 推論工作負載
定價 執行個體會產生標準價格的費用。詳情請參閱「VM 執行個體定價」。 多數 vCPU、GPU 和本機 SSD 均提供 60% 至 91% 的折扣。 詳情請參閱「Spot VM 定價」。 根據執行個體使用的機器系列,vCPU 和 GPU 最多可享 53% 的折扣。請參閱「動態工作負載排程器 (DWS) 定價」。 根據執行個體使用的機器系列,vCPU 和 GPU 最多可享 53% 的折扣。此外,您還會根據建立執行個體的容量預留方式產生費用,如下所示:
配額 建立執行個體時,會消耗標準配額。 建立執行個體時,會消耗先占配額 。如果專案沒有先占配額,系統就會使用標準配額。Google Cloud 免費方案抵免額不適用於 Spot VM。 當 MIG 將執行個體新增至群組時,系統會消耗先占配額。如果專案沒有先占配額,系統就會使用標準配額。 配額不適用於取決於預留項目的佈建模式。

執行個體可用性和生命週期

下表列出各佈建模式的運算執行個體可用性和生命週期:

標準 Spot 彈性啟動 (預覽版) 取決於預留項目
建立前的必要條件 建立時沒有任何條件限制。 建立時沒有任何條件限制。 建立時沒有任何條件限制。

如要建立執行個體,請先使用下列其中一種方法預留容量:

在您選擇的交付日期和時間,Compute Engine 會佈建您要求的容量。接著,您就能建立執行個體來使用容量。
支援的機器系列 除了 A4X、A4 和 A3 Ultra,您可以使用任何機型系列。 您可以使用任何機器系列,但下列系列除外:
  • M2 和 M3
  • 裸機執行個體
你只能使用下列機器系列:
根據您預留容量來建立 VM 的方式,您只能使用下列機器系列:
執行個體可用性 只要您要求的資源可用,隨時都能建立執行個體。 只要您要求的資源可用,隨時都能建立執行個體。 您只能在 MIG 中建立 規模調整要求,藉此建立執行個體。Compute Engine 會使用 DWS,根據資源可用性排定您要求的容量佈建作業。DWS 可協助您取得 GPU 等需求量高的資源。 您只能在預留未來日期的容量後,建立執行個體。在您要求的日期,Compute Engine 會提供您要求的容量,您可以使用這些容量建立執行個體。如果您在日曆模式下使用未來預留項目預訂資源,Compute Engine 會使用 DWS 佈建您要求的容量。DWS 可協助您取得 GPU 等需求量高的資源。
執行個體生命週期 您可以控管何時停止或刪除執行個體,但下列情況除外:
  • 如果執行個體使用的機器類型不支援即時遷移,Compute Engine 會在主機維護事件期間停止執行個體。
  • 在極少數情況下,執行個體可能會因主機錯誤而停止。
您可以控管何時停止或刪除執行個體,但下列情況除外:
  • Compute Engine 可能會隨時停止或刪除執行個體,以回收容量。這個程序稱為「搶占」
  • 如果執行個體使用的機器類型不支援即時遷移,Compute Engine 會在主機維護事件期間停止執行個體。
  • 在極少數情況下,執行個體可能會因主機錯誤而停止。
佈建的執行個體會按照您選擇的執行時間長度執行,最長可達七天。您無法停止、暫停或重新建立執行個體。

發生下列情況時,Compute Engine 會刪除執行個體:
  • 您要求刪除執行個體。
  • 執行個體達到執行時間上限。
您可以控管何時停止或刪除執行個體,但下列情況除外:
  • Compute Engine 會在主機維護事件期間停止執行個體。
  • 系統自動建立的預留項目,已達到佈建要求容量的承諾預留項目期限。屆時,Compute Engine 會刪除預留項目,並停止或刪除任何使用預留項目的執行個體。
  • 在極少數情況下,執行個體可能會因主機錯誤而停止。

後續步驟