購買已佈建的輸送量

本頁提供訂閱佈建輸送量前應考量的詳細資料、下單或查看佈建輸送量訂單時必須具備的權限,以及下單和查看標準佈建輸送量訂單的操作說明。

如要購買單一區域佈建輸送量,請與 Google Cloud 帳戶代表聯絡以尋求協助。 如要進一步瞭解單一可用區佈建處理量,請參閱「單一可用區佈建處理量」一文。

購買前的注意事項

為協助您決定是否要購買佈建輸送量,請考慮下列事項:

  • 您無法在約期中取消訂單。

    購買佈建輸送量即為承諾,因此您無法在合約期間中途取消訂單。不過,您可以增加購買的 GSU 數量。如果您意外購買了承諾產品或設定有問題,請與您的Google Cloud 帳戶代表聯絡,尋求協助。

  • 你可以自動續訂。

    提交訂單時,您可以選擇在訂閱方案到期時自動續訂,也可以選擇讓訂閱方案到期。你可以取消自動續訂程序。如要在自動續訂前取消訂閱,請在下個續訂期開始前 30 天取消自動續訂。

    你可以將按月訂閱方案設為每月自動續訂。 週訂方案不支援自動續訂。

    詳情請參閱「變更佈建輸送量訂單」。你也可以聯絡帳戶代表尋求協助。 Google Cloud

  • 我們會事先通知您,並變更自動續訂行為、模型、模型版本或區域。

    選擇專案、地區、模型、模型版本和自動續訂行為,並在訂單獲得核准及啟用後,系統就會啟用佈建輸送量,但須視可用容量而定。如要變更自動續訂行為、模型、模型版本或區域,請使用 Google Cloud 控制台修改現有的佈建輸送量訂單

    我們會盡力處理所有變更,通常會在收到要求後的 10 個工作天內完成。

    模型變更僅限特定發布商。舉例來說,您可以將「透過 Google 佈建的輸送量」的模型指派項目從 Google Gemini 2.0 Pro 切換為 Google Gemini 2.0 Flash,但無法從 Google Gemini 2.0 Flash 切換為 Anthropic 的 Claude 3.5 Sonnet v2。

  • 根據預設,超額用量會以即付即用方式計費。

    如果處理量超過訂購的佈建處理量,超出的部分會按標準即付即用價格計費。您可以根據要求控制超額用量。詳情請參閱「使用佈建輸送量」一文。

如需定價資訊,請參閱「佈建輸送量」。

為預先發布版模型購買佈建輸送量

如果模型的一般發布版本尚未推出,您可以購買 Google 模型預先發布版本的佈建輸送量。

如果您為預先發布版模型訂購了佈建輸送量,且該模型已正式發布,則可以採取下列任一做法:

  • 將訂單移至正式發布的模型版本。請注意,將訂單移至正式發布模型後,就無法再切換回預覽模型。如要進一步瞭解如何變更訂單,請參閱「變更佈建輸送量訂單」。

  • 或者,只要模型預覽版穩定,您就可以繼續使用預覽版的佈建輸送量。如要進一步瞭解穩定版和淘汰版模型,請參閱「模型版本和生命週期」。

角色和權限

下列角色具備管理 Vertex AI 已佈建處理量的完整存取權:

  • roles/aiplatform.provisionedThroughputAdmin:您可以存取 Vertex AI 已佈建處理量資源。

這個角色具備下列權限:

權限 說明
aiplatform.googleapis.com/provisionedThroughputs.create 提交新的佈建輸送量訂單。
aiplatform.googleapis.com/provisionedThroughputs.get 查看特定佈建的處理量訂單。
aiplatform.googleapis.com/provisionedThroughputs.list 查看所有佈建輸送量訂單。
aiplatform.googleapis.com/provisionedThroughputs.update 修改佈建的處理量訂單。
aiplatform.googleapis.com/provisionedThroughputs.cancel 取消待處理的訂單或更新。

建立標準佈建輸送量訂單

部分 Imagen 功能可能未對外公開。詳情請參閱「受限的正式發布和預先發布功能」。

如要訂購 MedLM-large-1.5,請先與帳戶代表聯絡 Google Cloud ,要求存取權。

如果預期 QPM 會超過 30,000 項,為確保佈建輸送量訂單發揮最大效益,請使用下列資訊,申請調整預設 Vertex AI 系統配額:

  • 服務:Vertex AI API。
  • Name (名稱):Online prediction requests per minute per region
  • 服務類型:配額。
  • 維度:您先前訂購佈建輸送量時的所在區域。
  • :您選定的線上預測流量上限。

系統會根據訂單大小和可用容量處理佈建輸送量訂單。視要求的 GSU 數量和可用容量而定,處理訂單可能需要幾分鐘到幾週的時間。下訂佈建輸送量時,您可以使用生成式 AI 擴充單元預估工具,計算需要購買的 GSU 數量。查看預估值後,您可以繼續進行,或修改要購買的 GSU 數量。

請按照下列步驟購買標準佈建輸送量。如需購買單一可用區佈建輸送量方面的協助,請與您的 Google Cloud 帳戶代表聯絡

控制台

  1. 前往 Google Cloud 控制台的「Provisioned Throughput」(佈建輸送量) 頁面。

    前往「已佈建處理量」

  2. 如要建立新訂單,請按一下「新訂單」
  3. 輸入訂單名稱
  4. 選取「模型」
  5. 選取「區域」
  6. 按一下「估算工具」
  7. 在「生成式 AI 擴充單元預估工具」窗格中,執行下列步驟來預估所需 GSU 數量。

    1. 選取「模型」
    2. 根據所選模型輸入詳細資料,即可估算所需的 GSU 數量。如要瞭解各機型的 GSU 最低購買量和購買增量,請參閱「支援的機型」。如要瞭解模型的功能和輸入/輸出限制,請參閱模型說明文件。

      • 如果是 Gemini 2.5 ProGemini 2.5 Flash 模型,請輸入下列內容:

        • 需要查驗的預估每秒查詢次數
        • 各查詢的輸入文字詞元數
        • 每項查詢的輸入圖像權杖數
        • 各查詢的輸入影片詞元數
        • 各查詢的輸入音訊詞元數
        • 各查詢的輸出回覆文字詞元數
        • 各查詢的輸出推論文字詞元數
        • 每項查詢的輸出圖片數 (僅適用於 Gemini 2.5 Flash Image 搶先版)
      • 如果是 Gemini 2.5 Flash with Live API 模型,請輸入以下內容:

        • 需要查驗的預估每秒查詢次數
        • 每項查詢的輸入權杖數
        • 各查詢的輸入音訊詞元數
        • 各查詢的輸入影片詞元數
        • 每項查詢的輸入工作階段記憶體權杖數
        • 每項查詢的輸出文字詞元數
        • 每項查詢的輸出音訊詞元數
      • 如果是 Gemini 2.5 Flash-Lite 模型,請輸入下列內容:

        • 需要查驗的預估每秒查詢次數
        • 各查詢的輸入文字詞元數
        • 每項查詢的輸入圖像權杖數
        • 各查詢的輸入影片詞元數
        • 各查詢的輸入音訊詞元數
        • 各查詢的輸出回覆文字詞元數
        • 各查詢的輸出推論文字詞元數
      • 如果是 Gemini 2.0 FlashGemini 2.0 Flash-Lite 模型,請輸入下列內容:

        • 需要查驗的預估每秒查詢次數
        • 每項查詢的輸入權杖數
        • 每項查詢的輸入圖像權杖數
        • 各查詢的輸入影片詞元數
        • 各查詢的輸入音訊詞元數
        • 每項查詢的輸出文字詞元數
      • 如果是 Veo 3Veo 3 Fast 模型,請輸入下列內容:

        • 需要查驗的預估每秒查詢次數
        • 各查詢的輸出影片秒數
        • 各查詢的輸出影片和音訊秒數
      • 如果是 Imagen 模型,請輸入下列內容:

        • 每秒查詢次數
        • 每項查詢的輸出圖片數
    3. 在「預估 GSU 數量和每月費用」部分,查看預估的 GSU 數量和價格。

  8. 按一下「使用計算結果」

  9. 選用:修改「每個月的生成式 AI 擴充單元 (GSU) 數量」

  10. 選取「Term」(期限)。請注意,約期未滿前無法取消合約,而且無論實際用量多寡或模型是否已停用,都必須支付這些費用。Google 建議您在停用日期之前更換指派的模型。Google 不會主動針對已停用的模型取消自動續訂功能。

    可用的選項如下:

    • 1 週
    • 1 個月
    • 3 個月
    • 1 年
  11. 選用:選取學期的「開始日期和時間」 (預覽版)。

    下單後,你可以在未來兩週內指定開始日期和時間。如未指定開始日期和時間,系統會在容量可用時立即處理訂單。系統會盡可能按照所要求的開始日期與時間處理訂單。如果訂單狀態未設為「已核准」,就不保證會在指定日期前完成。

    如果要求的開始日期與目前日期太接近,訂單可能會在要求的開始日期之後才獲得核准並啟用。在這種情況下,系統會根據所選方案的期限,從啟用日期開始調整結束日期。如要瞭解如何取消待處理訂單,請參閱「變更佈建的輸送量訂單」。

  12. 在「續訂」清單中,指定是否要在約期結束時自動續訂訂單。只有在選取 1 個月3 個月1 年做為期限時,才能指定續訂選項。

  13. 按一下「繼續」

  14. 在「確認並提交」部分,查看訂單的價格和輸送量預估值。閱讀表單中列出和連結的條款。

  15. 如要完成並提交訂單,請在「購買確認」欄位中輸入 CONFIRM,然後按一下「提交訂單」

    視訂單大小和可用容量而定,處理訂單可能需要幾分鐘到幾週的時間。訂單處理完畢後, Google Cloud 控制台中的訂單狀態會變更為「有效」。訂單生效後,系統才會向你收費。

變更標準佈建輸送量訂單

下表說明如何根據訂單狀態和現有條件,透過Google Cloud 控制台修改佈建輸送量訂單。修改訂單是預覽功能,僅適用於透過控制台下訂的線上訂單。如要變更離線訂單,請與Google Cloud 帳戶代表聯絡以尋求協助。

此外,使用 Google Cloud 控制台變更模型或模型版本時,系統會修改現有訂單,但訂閱結束日期維持不變。

訂單狀態 動作 注意 在 Google Cloud 控制台中執行步驟
待審核 你可以取消訂單。

如要進一步變更訂單,請取消待處理的訂單,然後重新下單。

如果你有多個模型,每個模型一次只能有一份待處理的訂單修訂或待處理的訂單。

如要在 Google Cloud 控制台中取消待處理的訂單,請按照下列步驟操作:
  1. 前往「佈建輸送量」頁面
  2. 選取待處理訂單所在的區域
  3. 如要前往「訂單詳細資料」頁面,請按一下要取消的訂單的「訂單 ID」
  4. 按一下「取消」
  5. 在「確定要取消訂單嗎?」對話方塊中,按一下「取消訂單」
已核准 你無法修改訂單。 訂單待啟用。 目前無法變更訂單。 不適用
已啟用

只有在訂單不會於五天內到期或自動續訂時,你才能進行下列變更:

  • 增加現有訂單的 GSU 數量。無論自動續約時間為何,只要核准增加 GSU 數量,系統就會立即套用。
  • 減少現有訂單的 GSU。系統會在下個約期自動續約時減少 GSU 數量。
  • 啟用或停用自動續訂。
  • 變更模型或模型版本。
  • 變更地區。
如果有效訂單會在五天內到期,且未設定自動續訂,就無法變更。 如要在 Google Cloud 控制台中變更有效訂單,請使用下列其中一種方法:
  • 在「Provisioned Throughput」(佈建輸送量) 頁面中,按一下「Actions」(動作) 欄中的符號,然後按一下「Edit」(編輯)
  • 在「訂單詳細資料」頁面中,按一下「編輯」按鈕。

檢查訂單狀態

提交佈建輸送量訂單後,訂單狀態可能會顯示為下列其中一種:

  • 待審查:你已下單,由於核准與否取決於可用的運算資源,因此訂單正在等待審查和核准。如要進一步瞭解待處理訂單的狀態,請聯絡帳戶代表 Google Cloud
  • 已核准:Google 已核准您的訂單,訂單待啟用。訂單核准後就無法變更。
  • 有效:Google 已啟用訂單,並開始計費。
  • 已過期:訂單已過期。

查看標準佈建輸送量訂單

如要查看佈建輸送量訂單,請按照下列步驟操作:

控制台

  1. 前往 Google Cloud 控制台的「佈建輸送量」頁面。

    前往「已佈建處理量」

  2. 選取「區域」。系統會顯示訂單清單。

後續步驟