自 2025 年 4 月 29 日起,Gemini 1.5 Pro 和 Gemini 1.5 Flash 模型將無法用於先前未使用這些模型的專案,包括新專案。詳情請參閱「
模型版本和生命週期」。
關於 Gemini 模型的監督式微調
透過集合功能整理內容
你可以依據偏好儲存及分類內容。
透過監督式微調,您可以根據特定需求調整 Gemini 模型。提供加上標籤的範例資料集,即可調整模型權重,進而提升模型在特定工作上的成效。如果您的任務明確,就很適合使用這種方法。在特定領域的應用實例中,如果基礎模型的語言或生成內容,與最初的訓練資料大相逕庭,則這項工具的成效將格外顯著。您可以透過文字、圖片、音訊和文件資料調整模型。
本頁面說明下列主題:
如要進一步瞭解微調的好處,請參閱「何時該對 Gemini 進行監督式微調」和「數百個機構正在微調 Gemini 模型。以下是他們最喜歡的用途。
監督式微調的用途
如果預期輸出內容或工作可透過提示清楚簡潔地定義,且提示一律會產生預期輸出內容,就很適合使用基礎模型。如果您希望模型學習與一般模式偏離的特定領域或特定知識,請考慮微調該模型。舉例來說,您可以透過模型微調功能,教導模型執行下列操作:
- 產生輸出內容的特定結構或格式。
- 特定行為,例如何時提供簡潔或詳細的輸出內容。
- 針對特定類型的輸入內容,提供特定的自訂輸出內容。
以下範例是僅使用提示指令難以擷取的應用情境:
分類:預期的回應是特定字詞或詞組。調整模型有助於避免生成冗長的回覆。
摘要:摘要會以特定格式顯示。舉例來說,您可能需要移除對話摘要中的個人識別資訊 (PII)。在提示中,以 #Person1
和 #Person2
取代名稱的格式並不容易描述,基礎模型可能無法自然產生這類回應。
擷取問題解答:問題與內容相關,答案是內容的子字串。
對話:您需要自訂模型回覆,讓模型扮演特定角色或人物。
您也可以在下列情況微調模型:
- 提示無法持續產生預期結果。
- 工作過於複雜,無法在提示中定義 (例如難以清楚表達的行為,因此無法複製)。
- 您對某項工作有複雜的直覺,但難以在提示中正式化。
- 您想從提示中移除少量樣本,藉此縮短背景資訊長度。
支援的模型
下列 Gemini 模型支援監督式微調:
如果是支援思考的模型,請將思考預算設為關閉或最低值。這項功能可提升微調工作的效能並降低成本。在監督式微調期間,模型會從訓練資料學習,並省略思考過程。因此,經過微調的模型可以有效執行微調任務,而不需要思考預算。
限制
Gemini 2.5 Flash
Gemini 2.5 Flash-Lite
規格 |
值 |
輸入和輸出訓練詞元數量上限 |
131,072 |
輸入和輸出服務的詞元數量上限 |
與基礎 Gemini 模型相同 |
驗證資料集大小上限 |
5000 個樣本 |
訓練資料集檔案大小上限 |
JSONL 檔案為 1 GB |
訓練資料集大小上限 |
100 萬個純文字範例或 30 萬個多模態範例 |
轉接器大小 |
支援的值為 1、2、4、8 和 16 |
Gemini 2.5 Pro
規格 |
值 |
輸入和輸出訓練詞元數量上限 |
131,072 |
輸入和輸出服務的詞元數量上限 |
與基礎 Gemini 模型相同 |
驗證資料集大小上限 |
5000 個樣本 |
訓練資料集檔案大小上限 |
JSONL 檔案為 1 GB |
訓練資料集大小上限 |
100 萬個純文字範例或 30 萬個多模態範例 |
轉接器大小 |
支援的值為 1、2、4 和 8 |
Gemini 2.0 Flash
Gemini 2.0 Flash-Lite
規格 |
值 |
輸入和輸出訓練詞元數量上限 |
131,072 |
輸入和輸出服務的詞元數量上限 |
與基礎 Gemini 模型相同 |
驗證資料集大小上限 |
5000 個樣本 |
訓練資料集檔案大小上限 |
JSONL 檔案為 1 GB |
訓練資料集大小上限 |
100 萬個純文字範例或 30 萬個多模態範例 |
轉接器大小 |
支援的值為 1、2、4 和 8 |
已知問題
- 向微調過的 Gemini 模型提交推論要求時,套用「控制生成」功能可能會導致模型品質下降。調整期間不會套用受控生成功能,因此調整後的模型在推論時無法妥善處理。由於監督式微調會自訂模型,以生成結構化輸出內容,因此對微調模型提出推論要求時,您不需要套用控制生成技術。
設定微調工作區域
執行微調工作時,系統會將資料 (包括轉換後的資料集和最終微調模型) 儲存在您指定的區域。如要使用可用的硬體加速器,運算作業可能會卸載至 US
或 EU
多區域內的其他區域。這項程序公開透明,不會改變資料的儲存位置。
您可以透過下列方式指定微調工作的區域:
Vertex AI SDK:初始化用戶端時指定區域。
import vertexai
vertexai.init(project='myproject', location='us-central1')
REST API:如果您傳送 POST
要求至 tuningJobs.create
方法,藉此建立受監督的微調作業,請使用網址指定區域。將 TUNING_JOB_REGION
的兩個執行個體替換為工作執行的地區。
https://TUNING_JOB_REGION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/TUNING_JOB_REGION/tuningJobs
Google Cloud 控制台:在模型建立工作流程中,從「Model details」(模型詳細資料) 頁面的「Region」(區域) 下拉式清單中選取區域。
配額
配額會限制可同時執行的微調作業數量。每個專案都有預設配額,至少可執行一項微調作業。這是全域配額,適用於所有可用區域和支援的模型。如要同時執行更多工作,請申請更多 Global concurrent tuning jobs
配額。
定價
如需定價詳細資料,請參閱 Vertex AI 定價。
後續步驟
除非另有註明,否則本頁面中的內容是採用創用 CC 姓名標示 4.0 授權,程式碼範例則為阿帕契 2.0 授權。詳情請參閱《Google Developers 網站政策》。Java 是 Oracle 和/或其關聯企業的註冊商標。
上次更新時間:2025-08-19 (世界標準時間)。
[[["容易理解","easyToUnderstand","thumb-up"],["確實解決了我的問題","solvedMyProblem","thumb-up"],["其他","otherUp","thumb-up"]],[["難以理解","hardToUnderstand","thumb-down"],["資訊或程式碼範例有誤","incorrectInformationOrSampleCode","thumb-down"],["缺少我需要的資訊/範例","missingTheInformationSamplesINeed","thumb-down"],["翻譯問題","translationIssue","thumb-down"],["其他","otherDown","thumb-down"]],["上次更新時間:2025-08-19 (世界標準時間)。"],[],[]]