本頁說明如何使用 Vertex AI Search 的資料,為回覆內容建立基準。
以您的資料為 Gemini 建立基準
如要執行檢索增強生成 (RAG),請將模型連結至網站資料或文件集,然後使用 Vertex AI Search 建立基準。
以自有資料建立基準最多支援 10 個 Vertex AI Search 資料來源,且可與利用 Google 搜尋建立基準搭配使用。
支援的模型
本節列出支援以資料為基礎的基礎模型。
- Gemini 2.5 Flash-Lite
- Gemini 2.5 Flash with Live API native audio (預先發布版)
- Gemini 2.0 Flash with Live API (預先發布版)
- Gemini 2.5 Pro
- Gemini 2.5 Flash
- Gemini 2.0 Flash
必要條件
如要使用自有資料做為模型輸出內容的基準,請先完成下列步驟:
前往 Google Cloud 控制台的「IAM」IAM頁面,然後搜尋
discoveryengine.servingConfigs.search
權限,這是基礎服務運作的必要權限。啟用 AI Applications 並啟動 API。
建立 AI 應用程式資料來源和應用程式。
詳情請參閱 Vertex AI Search 簡介。
啟用 AI Applications
前往 Google Cloud 控制台的「AI Applications」頁面。
詳閱並同意《服務條款》,然後按一下「Continue and activate the API」(繼續並啟用 API)。
AI Applications 適用於 global
地區,或 eu
和 us
多地區。詳情請參閱「AI Applications 地區」
在 AI Applications 中建立資料儲存庫
如要在 AI 應用程式中建立資料儲存庫,您可以選擇以網站資料或文件做為回覆基準。
網站
在「網站內容」方塊中,按一下「選取」。
「為資料儲存庫指定網站」窗格隨即顯示。如果「進階網站索引建立功能」未勾選,請選取「進階網站索引建立功能」核取方塊,將其開啟。
「設定資料儲存庫」窗格隨即顯示。在「指定要建立索引的網址模式」部分,完成下列操作:
- 新增「要包含的網站」網址。
- 選用:新增要排除的網站網址。
按一下「繼續」。
在「設定資料儲存庫」窗格中,
- 從「資料儲存庫位置」清單中選取值。
- 在「Your data store name」(資料儲存庫名稱) 欄位中輸入名稱。系統會產生 ID。使用資料儲存庫生成有憑有據的回覆時,請使用這個 ID。詳情請參閱「使用資料存放區產生有根據的回覆」。
- 點選「建立」。
文件
在「Cloud Storage」方塊中,按一下「選取」。
「從 Cloud Storage 匯入資料」窗格隨即顯示。在「非結構化文件 (PDF、HTML 和 TXT 等)」部分,選取「非結構化文件 (PDF、HTML 和 TXT 等)」。
選取「同步頻率」選項。
選取「Select a folder or a file you want to import」(選取要匯入的資料夾或檔案) 選項,然後在欄位中輸入路徑。
按一下「繼續」。系統會顯示「設定資料儲存庫」窗格。
在「設定資料儲存庫」窗格中,
- 從「資料儲存庫位置」清單中選取值。
- 在「Your data store name」(資料儲存庫名稱) 欄位中輸入名稱。系統會產生 ID。
- 如要為文件選取剖析和分塊選項,請展開「文件處理選項」部分。如要進一步瞭解不同的剖析器,請參閱「剖析文件」。
- 點選「建立」。
點選「建立」。
根據資料儲存庫生成有憑有據的回覆
請按照下列操作說明,使用資料做為模型基礎。最多支援 10 個資料儲存區。
如果不知道資料儲存庫 ID,請按照下列步驟操作:
前往 Google Cloud 控制台的「AI Applications」頁面,然後點按導覽選單中的「Data Stores」(資料儲存庫)。
點按資料儲存庫的名稱。
在資料儲存庫的「資料」頁面中,取得資料儲存庫 ID。
控制台
如要使用Google Cloud 控制台中的 Vertex AI Studio,將模型輸出內容與 AI 應用程式連結,請按照下列步驟操作:
- 前往 Google Cloud 控制台的「Vertex AI Studio Freeform」頁面。
- 如要開啟「以您的資料建立基準」功能,請按一下「以您的資料建立基準」切換鈕。
- 按一下「自訂」。
- 選取「Vertex AI Search」做為來源。
- 使用這個路徑格式,將資料儲存庫的專案 ID 和資料儲存庫的 ID 替換為:
projects/project_id/locations/global/collections/default_collection/dataStores/data_store_id.
- 按一下「儲存」。
- 在文字方塊中輸入提示,然後按一下「提交」。
提示回覆會以 AI 應用程式為依據。
Python
在試用這個範例之前,請先按照Python使用用戶端程式庫的 Vertex AI 快速入門中的操作說明進行設定。 詳情請參閱 Vertex AI Python API 參考說明文件。
如要向 Vertex AI 進行驗證,請設定應用程式預設憑證。 詳情請參閱「為本機開發環境設定驗證」。
REST
如要使用 Vertex AI API 測試文字提示,請將 POST 要求傳送至發布商模型端點。
使用任何要求資料之前,請先替換以下項目:
- LOCATION:處理要求的區域。
- PROJECT_ID:您的專案 ID。
- MODEL_ID:多模態模型的模型 ID。
- TEXT: 提示中要加入的文字指令。
HTTP 方法和網址:
POST https://LOCATION-aiplatform.googleapis.com/v1beta1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/MODEL_ID:generateContent
JSON 要求主體:
{ "contents": [{ "role": "user", "parts": [{ "text": "TEXT" }] }], "tools": [{ "retrieval": { "vertexAiSearch": { "datastore": projects/PROJECT_ID/locations/global/collections/default_collection/dataStores/DATA_STORE_ID } } }], "model": "projects/PROJECT_ID/locations/LOCATION/publishers/google/models/MODEL_ID" }
如要傳送要求,請展開以下其中一個選項:
您應該會收到如下的 JSON 回應:
{ "candidates": [ { "content": { "role": "model", "parts": [ { "text": "You can make an appointment on the website https://dmv.gov/" } ] }, "finishReason": "STOP", "safetyRatings": [ "..." ], "groundingMetadata": { "retrievalQueries": [ "How to make appointment to renew driving license?" ], "groundingChunks": [ { "retrievedContext": { "uri": "https://vertexaisearch.cloud.google.com/grounding-api-redirect/AXiHM.....QTN92V5ePQ==", "title": "dmv" } } ], "groundingSupport": [ { "segment": { "startIndex": 25, "endIndex": 147 }, "segment_text": "ipsum lorem ...", "supportChunkIndices": [1, 2], "confidenceScore": [0.9541752, 0.97726375] }, { "segment": { "startIndex": 294, "endIndex": 439 }, "segment_text": "ipsum lorem ...", "supportChunkIndices": [1], "confidenceScore": [0.9541752, 0.9325467] } ] } } ], "usageMetadata": { "..." } }
瞭解回覆內容
這兩個 API 的回覆都會包含 LLM 生成的文字,稱為「候選項目」。如果模型提示成功參照資料來源,回覆就會包含參照中繼資料,指出回覆中衍生自資料的部分。不過,這類中繼資料可能因多種原因而未提供,因此提示回應不會以中繼資料為依據。可能原因包括來源關聯性低,或是模型回覆中資訊不完整。
輸出資料的細目如下:
- 角色:指出已建立基準答案的傳送者。由於回覆一律包含有根據的文字,因此角色一律為
model
。 - 文字:LLM 生成的依據答案。
- 建立基準中繼資料:建立基準來源的相關資訊,包含下列元素:
- 基礎塊:索引中的結果清單,可支援答案。
- 建立基準支援:答案中特定聲明的相關資訊,可用於顯示引文:
- 片段:模型答案中由基礎事實塊佐證的部分。
- 基礎事實區塊索引:基礎事實區塊清單中的基礎事實區塊索引,對應這項聲明。
- 信心分數:介於 0 到 1 之間的數字,表示聲明在所提供的基礎區塊集中,有多大程度的根據。不適用於 Gemini 2.5 以上版本。