您傳送至模型的每個呼叫都含有參數值,用來控制模型生成回覆的方式,參數值不同,生成的結果也可能會不同。實驗不同參數值,取得最適合工作目標的結果。不同模型可用的參數不盡相同。最常見的參數如下:
- 輸出詞元數量上限
- 溫度參數
- Top-P
- Top-K
- 種子
輸出詞元數量上限
回覆內可以生成的權杖數量上限。一個符記約為四個字元。100 個符記約等於 60 到 80 個字。如要取得較短的回覆,請指定較低的值;如要取得可能較長的回覆,請調高此值。
溫度參數
系統會在套用topP
和 topK
時,使用溫度在生成回覆期間進行取樣。溫度參數會決定選取詞元時的隨機程度。
如果希望提示生成較不具開放性和創意性的回覆,建議調低溫度參數。另一方面,如果溫度參數較高,則可能產生較多元或有創意的結果。如果溫度參數為 0
,模型一律會選取可能性最高的詞元。在這種情況下,特定提示的回覆大多是確定性的,但仍可能出現少量差異。如果模型的回覆太普通、太短或提供了備用回覆,再試試看調高 Temperature。
Gemini 模型支援的溫度值介於 0.0 和 2.0 之間。模型的預設溫度為 1.0。
Top-P
「Top-P」會影響模型選取輸出符記的方式。模型會按照可能性最高到最低的順序選取符記,直到所選符記的可能性總和等於 Top-P 值。舉例來說,假設詞元 A、B 和 C 的可能性分別為 0.3、0.2 和 0.1,而「Top-P」值為0.5
,模型會依據 temperature 選擇 A 或 B 做為下一個詞元,並排除 C。如要取得較不隨機的回覆,請指定較低的值;如要取得較隨機的回覆,請調高此值。
Top-K
「Top-K」會影響模型選取輸出符記的方式。如果 Top-K 設為1
,代表下一個所選詞元是模型詞彙表的所有詞元中可能性最高者 (也稱為「貪婪解碼」)。如果 Top-K 設為 3
,則代表模型會依據 temperature,從可能性最高的 3 個詞元中選取下一個詞元。在每個符記選取步驟中,模型會對機率最高的「Top-K」符記取樣,接著進一步根據「Top-P」篩選詞元,最後依 temperature 選出最終詞元。
如要取得較不隨機的回覆,請指定較低的值;如要取得較隨機的回覆,請調高此值。
種子
如果將種子固定為特定值,模型會盡可能為重複要求提供相同的回覆。我們不保證輸出內容具有確定性。 此外,即使使用相同的種子值,如果變更模型或參數設定 (例如溫度),回覆還是有可能不同。根據預設,系統會使用隨機種子值。這是預先發布版功能。
後續步驟
- 在提示庫中探索提示範例。
- 瞭解如何使用 Vertex AI 提示最佳化工具 (搶先版),將提示最佳化,以便搭配 Google 模型使用。