使用 RAG 建立回覆基準

基準化技術可協助模型生成更值得信賴、實用且符合事實的回覆。建立生成式 AI 模型回覆的基準時,您可以將回覆內容連結至可驗證的資訊來源。如要實作基礎,通常必須擷取相關來源資料。建議的最佳做法是使用檢索增強生成 (RAG) 技術。檢索工作通常由搜尋引擎負責處理,這個工具會使用索引,其中嵌入了來源文字的語意。

此外,還有實作 RAG 生命週期的服務和元件 API,例如 Vertex AI Search Builder API,可讓您混搭建構。您可以混搭使用下列任一服務或 API,實作 RAG 解決方案:

  • 基準生成 API:可用於實作基準,或連結至檢索供應商,完成整個 RAG 生命週期。
  • 文件版面配置剖析器:這個剖析器結合了 Document AI 和 Gemini 的優勢,可提供最佳的文件理解體驗。如要進一步瞭解版面配置剖析器,請參閱「使用版面配置剖析器」。
  • Vertex AI Vector Search:這項搜尋服務效能極高,並使用高品質的向量資料庫。
  • Check grounding API:這個 API 會比較 RAG 輸出內容與擷取的事實,確保所有陳述內容都有根據,再將回應傳回給使用者。

使用 Vertex AI RAG 引擎建立回覆基準

如要使用 Vertex AI RAG 引擎建立回覆基準,請建立提示。請執行下列步驟:

  1. 在 Google Cloud 控制台中,使用 Vertex AI Studio 前往「建立提示詞」頁面。

    前往「建立提示」

  2. 選取「建立基準:您的資料」

  3. 選取 RAG Engine 依據來源。

  4. 從「語料庫」清單中選取語料庫名稱。

  5. 在「Top-K 相似度」欄位中,選取預設值「20」

  6. 按一下「儲存」

後續步驟