關於 Gemini 模型的監督式微調

透過監督式微調,您可以根據特定需求調整 Gemini 模型。提供加上標籤的範例資料集,即可調整模型權重,進而提升模型在特定工作上的成效。如果您的任務明確,就很適合使用這種方法。在特定領域的應用實例中,如果基礎模型的語言或生成內容,與最初的訓練資料大相逕庭,則這項工具的成效將格外顯著。您可以透過文字圖片音訊文件資料調整模型。

本頁面說明下列主題:

如要進一步瞭解微調的好處,請參閱「何時該對 Gemini 進行監督式微調」和「數百個機構正在微調 Gemini 模型。以下是他們最喜歡的用途

監督式微調的用途

如果預期輸出內容或工作可透過提示清楚簡潔地定義,且提示一律會產生預期輸出內容,就很適合使用基礎模型。如果您希望模型學習與一般模式偏離的特定領域或特定知識,請考慮微調該模型。舉例來說,您可以透過模型微調功能,教導模型執行下列操作:

  • 產生輸出內容的特定結構或格式。
  • 特定行為,例如何時提供簡潔或詳細的輸出內容。
  • 針對特定類型的輸入內容,提供特定的自訂輸出內容。

以下範例是僅使用提示指令難以擷取的應用情境:

  • 分類:預期的回應是特定字詞或詞組。調整模型有助於避免生成冗長的回覆。

  • 摘要:摘要會以特定格式顯示。舉例來說,您可能需要移除對話摘要中的個人識別資訊 (PII)。在提示中,以 #Person1#Person2 取代名稱的格式並不容易描述,基礎模型可能無法自然產生這類回應。

  • 擷取問題解答:問題與內容相關,答案是內容的子字串。

  • 對話:您需要自訂模型回覆,讓模型扮演特定角色或人物。

您也可以在下列情況微調模型:

  • 提示無法持續產生預期結果。
  • 工作過於複雜,無法在提示中定義 (例如難以清楚表達的行為,因此無法複製)。
  • 您對某項工作有複雜的直覺,但難以在提示中正式化。
  • 您想從提示中移除少量樣本,藉此縮短背景資訊長度。

支援的模型

下列 Gemini 模型支援監督式微調:

如果是支援思考的模型,請將思考預算設為關閉或最低值。這項功能可提升微調工作的效能並降低成本。在監督式微調期間,模型會從訓練資料學習,並省略思考過程。因此,經過微調的模型可以有效執行微調任務,而不需要思考預算。

限制

Gemini 2.5 Flash
Gemini 2.5 Flash-Lite

規格
輸入和輸出訓練詞元數量上限 131,072
輸入和輸出服務的詞元數量上限 與基礎 Gemini 模型相同
驗證資料集大小上限 5000 個樣本
訓練資料集檔案大小上限 JSONL 檔案為 1 GB
訓練資料集大小上限 100 萬個純文字範例或 30 萬個多模態範例
轉接器大小 支援的值為 1、2、4、8 和 16

Gemini 2.5 Pro

規格
輸入和輸出訓練詞元數量上限 131,072
輸入和輸出服務的詞元數量上限 與基礎 Gemini 模型相同
驗證資料集大小上限 5000 個樣本
訓練資料集檔案大小上限 JSONL 檔案為 1 GB
訓練資料集大小上限 100 萬個純文字範例或 30 萬個多模態範例
轉接器大小 支援的值為 1、2、4 和 8

Gemini 2.0 Flash
Gemini 2.0 Flash-Lite

規格
輸入和輸出訓練詞元數量上限 131,072
輸入和輸出服務的詞元數量上限 與基礎 Gemini 模型相同
驗證資料集大小上限 5000 個樣本
訓練資料集檔案大小上限 JSONL 檔案為 1 GB
訓練資料集大小上限 100 萬個純文字範例或 30 萬個多模態範例
轉接器大小 支援的值為 1、2、4 和 8

已知問題

  • 向微調過的 Gemini 模型提交推論要求時,套用「控制生成」功能可能會導致模型品質下降。調整期間不會套用受控生成功能,因此調整後的模型在推論時無法妥善處理。由於監督式微調會自訂模型,以生成結構化輸出內容,因此對微調模型提出推論要求時,您不需要套用控制生成技術。

設定微調工作區域

執行微調工作時,系統會將資料 (包括轉換後的資料集和最終微調模型) 儲存在您指定的區域。如要使用可用的硬體加速器,運算作業可能會卸載至 USEU 多區域內的其他區域。這項程序公開透明,不會改變資料的儲存位置。

您可以透過下列方式指定微調工作的區域:

  • Vertex AI SDK:初始化用戶端時指定區域。

    import vertexai
    vertexai.init(project='myproject', location='us-central1')
    
  • REST API:如果您傳送 POST 要求至 tuningJobs.create 方法,藉此建立受監督的微調作業,請使用網址指定區域。將 TUNING_JOB_REGION 的兩個執行個體替換為工作執行的地區。

     https://TUNING_JOB_REGION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/TUNING_JOB_REGION/tuningJobs
    
  • Google Cloud 控制台:在模型建立工作流程中,從「Model details」(模型詳細資料) 頁面的「Region」(區域) 下拉式清單中選取區域。

配額

配額會限制可同時執行的微調作業數量。每個專案都有預設配額,至少可執行一項微調作業。這是全域配額,適用於所有可用區域和支援的模型。如要同時執行更多工作,請申請更多 Global concurrent tuning jobs 配額

定價

如需定價詳細資料,請參閱 Vertex AI 定價

  • 調整費用:調整費用的計算方式是將訓練資料集中的權杖數量乘以訓練週期數。
  • 推論費用:微調後,對微調模型提出的預測要求會以標準推論價格計費。Gemini 各穩定版本的推論價格相同。詳情請參閱「Available Gemini stable model versions」一文。

後續步驟