比較提示

「比較」功能可讓您查看不同的提示、模型或參數設定對模型輸出內容有何影響。您可以並列查看每個提示及其回覆,並透過下列方式比較和分析:

  • 使用新提示。
  • 使用其他已儲存的提示。
  • 有基準真相。

事前準備

如要使用比較功能,請按照下列步驟操作:

  1. 前往 Google Cloud 控制台的「建立提示」頁面。

    前往「建立提示」

  2. 選取「比較」。系統隨即會顯示「比較」頁面。

在「比較」功能中建立提示

在「比較」頁面中,您可以先建立提示,再選取其他提示來比較結果。

如要建立提示,請按照下列步驟操作:

  1. 在「New Prompt」(新提示) 欄位中輸入提示。

  2. 點選「提交提示詞」。模型的回覆會顯示在您輸入的提示文字下方。

  3. 按一下「另存為新範本」,系統會顯示「儲存提示」對話方塊。

  4. 在「提示名稱」欄位中輸入新提示的名稱。

  5. 在「Region」(區域) 欄位中選取您的區域,或保留預設區域。

  6. 如果適用客戶自行管理的加密金鑰 (CMEK),請執行下列操作:

    1. 選取「客戶自行管理的加密金鑰 (CMEK)」核取方塊。
    2. 從「選取 Cloud KMS 金鑰」欄位選取金鑰。
  7. 按一下「儲存」,系統就會將提示儲存到提示清單,方便您在「比較儲存的提示」頁面使用。

  8. 按一下「提交提示」,比較提示和回覆。

您可以更新提示,並將更新後的版本儲存為新提示。

比較新提示

如要比較已儲存的提示與新提示,請按照下列步驟操作:

  1. 按一下「比較新提示」。「比較」窗格隨即顯示。
  2. 選用:按一下「切換模型」,即可使用預設模型以外的模型。
  3. 選用:展開「輸出」
  4. 輸出:
    1. 選用:如要模型以 JSON 等特定格式輸出內容,請按一下「結構化輸出」切換鈕。選取「結構化輸出」後,系統會關閉「建立基準」選項,因為結構化輸出不支援建立基準。
    2. 選用:將「思考預算」變更為下列其中一個選項:
      • 自動:模型只會在需要時思考。模型會按照當下需求,調整思考或分析情境的程度。
      • 手動:您可以調整思考預算權杖。
      • 停用:不思考,或不使用預算。
  1. 選用:展開「工具」
  2. 工具:
    1. 選取下列選項之一:
      • 建立基準:Google:使用 Google 搜尋或 Google 地圖來建立基準。
      • 建立基準:您的資料:使用 Vertex AI RAG Engine、Vertex AI Search 或 Elasticsearch 建立基準。
        1. 如果選取「以你的資料為依據」,請選取要使用的資料來源。
  1. 選用:展開「進階」
  2. 進階做法:
    1. 選取「區域」
    2. 選取「安全性篩選器設定」。系統隨即會顯示對話方塊。維持預設的「關閉」,或為下列每個選項指定「封鎖極少數內容」、「封鎖些許內容」或「封鎖多數內容」
      • 仇恨言論:針對身分或受保護特質發表負面或有害言論。
      • 危險內容:宣傳有害商品、服務與活動,或是提供接觸管道。
      • 情色露骨內容:提及性行為或其他猥褻情事的內容。
      • 騷擾內容:針對他人發表含有恐嚇、霸凌、辱罵或惡意意圖的言論。
    3. 按一下「儲存」儲存設定並關閉對話方塊。
    4. 從「溫度」欄位選取溫度。溫度參數會決定選取詞元時的隨機程度。如果希望生成正確或適當的回覆,建議調低溫度參數。如果溫度參數較高,可能會生成多樣化或預料之外的結果。
    5. 從「輸出詞元限制」欄位選取輸出詞元限制。輸出詞元限制會決定一段提示詞的輸出文字數量上限,一個詞元約為四個字元。
    6. 在「最多回覆數」欄位中選取最多回覆數。 個別提示產生的模型回覆數量上限。 回覆仍有可能因安全性篩選器或其他政策而遭到封鎖。
    7. 從「Top-P」欄位選取值。Top-P 會影響模型選取輸出詞元的方式。
    8. 按一下「逐字顯示模型回覆」欄位的切換鈕。如果選取這個選項,系統會在生成回覆時列印。
    9. 在「新增停止序列」欄位中輸入停止序列。每新增一個序列後就按下 Enter 鍵。
  1. 按一下「儲存」,儲存設定變更。
  2. 按一下 [套用]
  3. 按一下「提交提示」,比較提示和回覆。

如要進一步瞭解各模型的權杖限制,請參閱「控管思考預算」。

與其他儲存的提示比較

如要比較儲存的提示,請按照下列步驟操作:

  1. 按一下「比較儲存的提示」,「現有提示」窗格隨即顯示。
  2. 選取要比較的現有提示詞 (最多兩則)。

    1. 選取「提示名稱」。如果清單中有許多提示,請點選「篩選器」欄位,然後選取要篩選的屬性。輸入值,然後按下 Enter 鍵。
    2. 按一下 [套用]。「比較」頁面會顯示您選取的提示,以及您建立或選取用於比較的其他提示。
  3. 按一下「提交提示」,比較提示和回覆。

與真值比較

基準真相是指您希望提示產生的答案,系統會按照基準真相答案評估所有其他模型回覆。

如要比較已儲存的提示與基本事實,請按照下列步驟操作:

  1. 按一下「基準真相」。「基準真相」窗格隨即顯示。
  2. 輸入真值,產生更多評估指標。
  3. 按一下「儲存」即可儲存基本事實。
  4. 按一下「提交提示」,比較提示和回覆。

比較提示與實際資料時產生的評估指標,不會受到所選區域影響。

後續步驟