本頁提供訂閱佈建輸送量前應考量的詳細資料、下單或查看佈建輸送量訂單時必須具備的權限,以及下單和查看標準佈建輸送量訂單的操作說明。
如要購買單一區域佈建輸送量,請與 Google Cloud 帳戶代表聯絡以尋求協助。 如要進一步瞭解單一可用區佈建處理量,請參閱「單一可用區佈建處理量」一文。
購買前的注意事項
為協助您決定是否要購買佈建輸送量,請考慮下列事項:
您無法在約期中取消訂單。
購買佈建輸送量即為承諾,因此您無法在合約期間中途取消訂單。不過,您可以增加購買的 GSU 數量。如果您意外購買了承諾產品或設定有問題,請與您的Google Cloud 帳戶代表聯絡,尋求協助。
你可以自動續訂。
提交訂單時,您可以選擇在訂閱方案到期時自動續訂,也可以選擇讓訂閱方案到期。你可以取消自動續訂程序。如要在自動續訂前取消訂閱,請在下個續訂期開始前 30 天取消自動續訂。
你可以將按月訂閱方案設為每月自動續訂。 週訂方案不支援自動續訂。
我們會事先通知您,並變更自動續訂行為、模型、模型版本或區域。
選擇專案、地區、模型、模型版本和自動續訂行為,並在訂單獲得核准及啟用後,系統就會啟用佈建輸送量,但須視可用容量而定。如要變更自動續訂行為、模型、模型版本或區域,請使用 Google Cloud 控制台修改現有的佈建輸送量訂單。
我們會盡力處理所有變更,通常會在收到要求後的 10 個工作天內完成。
模型變更僅限特定發布商。舉例來說,您可以將「透過 Google 佈建的輸送量」的模型指派項目從 Google Gemini 2.0 Pro 切換為 Google Gemini 2.0 Flash,但無法從 Google Gemini 2.0 Flash 切換為 Anthropic 的 Claude 3.5 Sonnet v2。
根據預設,超額用量會以即付即用方式計費。
如果處理量超過訂購的佈建處理量,超出的部分會按標準即付即用價格計費。您可以根據要求控制超額用量。詳情請參閱「使用佈建輸送量」一文。
如需定價資訊,請參閱「佈建輸送量」。
為預先發布版模型購買佈建輸送量
如果模型的一般發布版本尚未推出,您可以購買 Google 模型預先發布版本的佈建輸送量。
如果您為預先發布版模型訂購了佈建輸送量,且該模型已正式發布,則可以採取下列任一做法:
將訂單移至正式發布的模型版本。請注意,將訂單移至正式發布模型後,就無法再切換回預覽模型。如要進一步瞭解如何變更訂單,請參閱「變更佈建輸送量訂單」。
或者,只要模型預覽版穩定,您就可以繼續使用預覽版的佈建輸送量。如要進一步瞭解穩定版和淘汰版模型,請參閱「模型版本和生命週期」。
角色和權限
下列角色具備管理 Vertex AI 已佈建處理量的完整存取權:
roles/aiplatform.provisionedThroughputAdmin
:您可以存取 Vertex AI 已佈建處理量資源。
這個角色具備下列權限:
權限 | 說明 |
---|---|
aiplatform.googleapis.com/provisionedThroughputs.create |
提交新的佈建輸送量訂單。 |
aiplatform.googleapis.com/provisionedThroughputs.get |
查看特定佈建的處理量訂單。 |
aiplatform.googleapis.com/provisionedThroughputs.list |
查看所有佈建輸送量訂單。 |
aiplatform.googleapis.com/provisionedThroughputs.update |
修改佈建的處理量訂單。 |
aiplatform.googleapis.com/provisionedThroughputs.cancel |
取消待處理的訂單或更新。 |
建立標準佈建輸送量訂單
部分 Imagen 功能可能未對外公開。詳情請參閱「受限的正式發布和預先發布功能」。
如要訂購 MedLM-large-1.5,請先與帳戶代表聯絡 Google Cloud ,要求存取權。
如果預期 QPM 會超過 30,000 項,為確保佈建輸送量訂單發揮最大效益,請使用下列資訊,申請調整預設 Vertex AI 系統配額:
- 服務:Vertex AI API。
- Name (名稱):
Online prediction requests per minute per region
- 服務類型:配額。
- 維度:您先前訂購佈建輸送量時的所在區域。
- 值:您選定的線上預測流量上限。
系統會根據訂單大小和可用容量處理佈建輸送量訂單。視要求的 GSU 數量和可用容量而定,處理訂單可能需要幾分鐘到幾週的時間。下訂佈建輸送量時,您可以使用生成式 AI 擴充單元預估工具,計算需要購買的 GSU 數量。查看預估值後,您可以繼續進行,或修改要購買的 GSU 數量。
請按照下列步驟購買標準佈建輸送量。如需購買單一可用區佈建輸送量方面的協助,請與您的 Google Cloud 帳戶代表聯絡。
控制台
- 前往 Google Cloud 控制台的「Provisioned Throughput」(佈建輸送量) 頁面。
- 如要建立新訂單,請按一下「新訂單」。
- 輸入訂單名稱。
- 選取「模型」。
- 選取「區域」。
- 按一下「估算工具」。
在「生成式 AI 擴充單元預估工具」窗格中,執行下列步驟來預估所需 GSU 數量。
- 選取「模型」。
根據所選模型輸入詳細資料,即可估算所需的 GSU 數量。如要瞭解各機型的 GSU 最低購買量和購買增量,請參閱「支援的機型」。如要瞭解模型的功能和輸入/輸出限制,請參閱模型說明文件。
如果是 Gemini 2.5 Pro 和 Gemini 2.5 Flash 模型,請輸入下列內容:
- 需要查驗的預估每秒查詢次數
- 各查詢的輸入文字詞元數
- 每項查詢的輸入圖像權杖數
- 各查詢的輸入影片詞元數
- 各查詢的輸入音訊詞元數
- 各查詢的輸出回覆文字詞元數
- 各查詢的輸出推論文字詞元數
- 每項查詢的輸出圖片數 (僅適用於 Gemini 2.5 Flash Image 搶先版)
如果是 Gemini 2.5 Flash with Live API 模型,請輸入以下內容:
- 需要查驗的預估每秒查詢次數
- 每項查詢的輸入權杖數
- 各查詢的輸入音訊詞元數
- 各查詢的輸入影片詞元數
- 每項查詢的輸入工作階段記憶體權杖數
- 每項查詢的輸出文字詞元數
- 每項查詢的輸出音訊詞元數
如果是 Gemini 2.5 Flash-Lite 模型,請輸入下列內容:
- 需要查驗的預估每秒查詢次數
- 各查詢的輸入文字詞元數
- 每項查詢的輸入圖像權杖數
- 各查詢的輸入影片詞元數
- 各查詢的輸入音訊詞元數
- 各查詢的輸出回覆文字詞元數
- 各查詢的輸出推論文字詞元數
如果是 Gemini 2.0 Flash 和 Gemini 2.0 Flash-Lite 模型,請輸入下列內容:
- 需要查驗的預估每秒查詢次數
- 每項查詢的輸入權杖數
- 每項查詢的輸入圖像權杖數
- 各查詢的輸入影片詞元數
- 各查詢的輸入音訊詞元數
- 每項查詢的輸出文字詞元數
如果是 Veo 3 和 Veo 3 Fast 模型,請輸入下列內容:
- 需要查驗的預估每秒查詢次數
- 各查詢的輸出影片秒數
- 各查詢的輸出影片和音訊秒數
如果是 Imagen 模型,請輸入下列內容:
- 每秒查詢次數
- 每項查詢的輸出圖片數
在「預估 GSU 數量和每月費用」部分,查看預估的 GSU 數量和價格。
按一下「使用計算結果」。
選用:修改「每個月的生成式 AI 擴充單元 (GSU) 數量」。
選取「Term」(期限)。請注意,約期未滿前無法取消合約,而且無論實際用量多寡或模型是否已停用,都必須支付這些費用。Google 建議您在停用日期之前更換指派的模型。Google 不會主動針對已停用的模型取消自動續訂功能。
可用的選項如下:
- 1 週
- 1 個月
- 3 個月
- 1 年
選用:選取學期的「開始日期和時間」 (預覽版)。
下單後,你可以在未來兩週內指定開始日期和時間。如未指定開始日期和時間,系統會在容量可用時立即處理訂單。系統會盡可能按照所要求的開始日期與時間處理訂單。如果訂單狀態未設為「已核准」,就不保證會在指定日期前完成。
如果要求的開始日期與目前日期太接近,訂單可能會在要求的開始日期之後才獲得核准並啟用。在這種情況下,系統會根據所選方案的期限,從啟用日期開始調整結束日期。如要瞭解如何取消待處理訂單,請參閱「變更佈建的輸送量訂單」。
在「續訂」清單中,指定是否要在約期結束時自動續訂訂單。只有在選取 1 個月、3 個月或 1 年做為期限時,才能指定續訂選項。
按一下「繼續」。
在「確認並提交」部分,查看訂單的價格和輸送量預估值。閱讀表單中列出和連結的條款。
如要完成並提交訂單,請在「購買確認」欄位中輸入
CONFIRM
,然後按一下「提交訂單」。視訂單大小和可用容量而定,處理訂單可能需要幾分鐘到幾週的時間。訂單處理完畢後, Google Cloud 控制台中的訂單狀態會變更為「有效」。訂單生效後,系統才會向你收費。
變更標準佈建輸送量訂單
下表說明如何根據訂單狀態和現有條件,透過Google Cloud 控制台修改佈建輸送量訂單。修改訂單是預覽功能,僅適用於透過控制台下訂的線上訂單。如要變更離線訂單,請與Google Cloud 帳戶代表聯絡以尋求協助。
此外,使用 Google Cloud 控制台變更模型或模型版本時,系統會修改現有訂單,但訂閱結束日期維持不變。
訂單狀態 | 動作 | 注意 | 在 Google Cloud 控制台中執行步驟 |
---|---|---|---|
待審核 | 你可以取消訂單。 |
如要進一步變更訂單,請取消待處理的訂單,然後重新下單。 如果你有多個模型,每個模型一次只能有一份待處理的訂單修訂或待處理的訂單。 |
如要在 Google Cloud 控制台中取消待處理的訂單,請按照下列步驟操作:
|
已核准 | 你無法修改訂單。 | 訂單待啟用。 目前無法變更訂單。 | 不適用 |
已啟用 |
只有在訂單不會於五天內到期或自動續訂時,你才能進行下列變更:
|
如果有效訂單會在五天內到期,且未設定自動續訂,就無法變更。 | 如要在 Google Cloud 控制台中變更有效訂單,請使用下列其中一種方法: |
檢查訂單狀態
提交佈建輸送量訂單後,訂單狀態可能會顯示為下列其中一種:
- 待審查:你已下單,由於核准與否取決於可用的運算資源,因此訂單正在等待審查和核准。如要進一步瞭解待處理訂單的狀態,請聯絡帳戶代表 Google Cloud 。
- 已核准:Google 已核准您的訂單,訂單待啟用。訂單核准後就無法變更。
- 有效:Google 已啟用訂單,並開始計費。
- 已過期:訂單已過期。
查看標準佈建輸送量訂單
如要查看佈建輸送量訂單,請按照下列步驟操作:
控制台
- 前往 Google Cloud 控制台的「佈建輸送量」頁面。
- 選取「區域」。系統會顯示訂單清單。