調校簡介

模型微調是指調整 Gemini,讓模型更精準地執行特定下游工作。模型調整的運作方式是為模型提供訓練資料集,資料集內有特定下游任務的範例。

本頁提供 Gemini 模型微調的總覽,涵蓋下列主題:

模型調整的好處

模型調整是針對任務自訂大型模型的有效方法。這是提升模型品質和效率的關鍵步驟。模型調整有以下好處:

  • 品質更高:提升模型在特定工作上的效能。
  • 提升模型穩定性:讓模型更能因應輸入內容的變化。
  • 降低推論成本和延遲時間:縮短提示,降低成本和縮短回應時間。

微調與提示設計的比較

下表比較提示設計和微調:

方法 說明 適用情境
提示設計 撰寫有效指令,引導模型輸出內容,不需變更模型本身。 快速製作原型、標記資料有限的任務,或是需要快速取得基準效能時。
微調 使用自訂標籤資料集重新訓練基礎模型,調整權重以適應特定工作。 複雜或獨特的工作、提高品質,以及擁有大量資料集 (100 個以上的範例)。

在提示設計和微調之間做決定時,請參考下列建議:

  • 首先設計提示,找出最佳提示。如有需要,請使用微調功能進一步提升效能,或修正重複發生的錯誤。
  • 新增更多資料前,請先評估模型出錯的地方。
  • 優先提供高品質且標籤正確的資料,而非大量資料。
  • 請確保用於微調的資料反映模型在正式環境中遇到的提示分布情形、格式和背景資訊。

與提示設計相比,微調有下列優點:

  • 進一步自訂:可進一步自訂模型,提升特定工作的成效。
  • 更準確的對齊:根據自訂語法、指令和特定領域的語意規則調整模型。
  • 結果更一致:提供更一致且可靠的輸出內容。
  • 處理更多範例:在單一提示中處理更多範例。
  • 降低推論成本:提示中不需要少樣本範例和長篇指令,可節省推論成本。

調整方法

高效參數調整和完整微調是兩種自訂大型模型的方法。這兩種方法各有優點,也會對模型品質和資源效率造成影響。

調整方法 說明 優點 缺點
高效參數調整 (適應器調整) 只更新模型的一小部分參數。 資源效率高、經濟實惠、使用較小資料集即可加快訓練速度,且可彈性用於多項工作學習。 對於複雜度高的任務,可能無法達到與全面微調相同的最高品質。
完整微調 更新模型的所有參數。 可處理高難度任務,並提供更高品質的結果。 需要大量運算資源,調整和提供服務的成本較高。

高效參數調整 (PET),又稱適應器調整,會更新模型的一小部分參數。相較於完整微調,這種做法更有效率且具成本效益。這項技術可使用較小的資料集更快調整模型,並提供彈性的多工作學習解決方案,不必進行大規模重新訓練。如要瞭解 Vertex AI 如何支援轉接器微調和服務,請參閱「大型基礎模型的調整方法」白皮書。

完整微調會更新模型的所有參數。這個方法適合用來調整模型,以處理高難度任務,並可獲得更高品質的結果。不過,微調和提供服務都需要大量運算資源,因此整體成本較高。

支援的調整方法

Vertex AI 支援監督式微調,可自訂基礎模型。

監督式微調

監督式微調會使用數百個有標籤的範例資料集,教導模型新技能,進而提升模型效能。每個有標籤的範例都會示範模型在推論期間應輸出的結果。

執行監督式微調作業時,模型會學習額外參數,以便將必要資訊編碼,並執行所需工作或瞭解應有行為。這些參數會在推論期間使用。完成調整後,就會產生一個新的模型,結合新學到的參數與原始模型。

如果文字模型的輸出內容不複雜且較容易定義,對模型進行監督式微調會是不錯的選擇,如果任務不複雜,監督式微調是個不錯的選擇,適合用於分類、情緒分析、實體擷取、內容摘要,以及撰寫特定領域的查詢。程式碼模型僅支援監督式調整。

支援監督式微調的模型

下列 Gemini 模型支援監督式微調:

如要進一步瞭解如何使用不同資料類型進行監督式微調,請參閱如何使用文字圖片音訊文件資料調整模型。

後續步驟