本頁面由 Cloud Translation API 翻譯而成。

利用 Vertex AI Search 建立基準

本頁說明如何使用 Vertex AI Search 的資料，為回覆內容建立基準。

以您的資料為 Gemini 建立基準

如要執行檢索增強生成 (RAG)，請將模型連結至網站資料或文件集，然後使用 Vertex AI Search 建立基準。

以自有資料建立基準最多支援 10 個 Vertex AI Search 資料來源，且可與利用 Google 搜尋建立基準搭配使用。

支援的模型

本節列出支援以資料為基礎的基礎模型。

Gemini 2.5 Flash (預先發布版)
Gemini 2.5 Flash-Lite (預先發布版)
Gemini 2.5 Flash-Lite
Gemini 2.5 Flash，搭配 Live API 原生音訊 (預先發布版)
Gemini 2.0 Flash with Live API (Preview)
Gemini 2.5 Pro
Gemini 2.5 Flash
Gemini 2.0 Flash

必要條件

如要使用自有資料做為模型輸出內容的基準，請先完成下列步驟：

前往 Google Cloud 控制台的「IAM」頁面，然後搜尋 discoveryengine.servingConfigs.search 權限，這是基礎服務運作的必要權限。

前往「IAM」頁面
啟用 AI Applications 並啟動 API。
建立 AI 應用程式資料來源和應用程式。

詳情請參閱 Vertex AI Search 簡介。

啟用 AI Applications

前往 Google Cloud 控制台的「AI Applications」頁面。

AI 應用程式
詳閱並同意《服務條款》，然後按一下「Continue and activate the API」(繼續並啟用 API)。

重要事項： 如要透過專案使用 AI 應用程式，必須為每個專案接受「探索解決方案」資料使用條款。

AI Applications 適用於 global 地區，或 eu 和 us 多地區。詳情請參閱「AI Applications 地區」

在 AI Applications 中建立資料儲存庫

如要在 AI 應用程式中建立資料儲存庫，您可以選擇以網站資料或文件做為回覆基準。

網站

從 Google Cloud 控制台開啟「建立資料儲存庫」頁面。
在「網站內容」方塊中，按一下「選取」。
系統會顯示「為資料儲存庫指定網站」窗格。
如果「進階網站索引建立功能」未勾選，請選取「進階網站索引建立功能」核取方塊，將其開啟。
「設定資料儲存庫」窗格隨即顯示。
在「指定要建立索引的網址模式」部分，完成下列操作：
- 新增「要包含的網站」網址。
- 選用：新增要排除的網站網址。
按一下「繼續」。
在「設定資料儲存庫」窗格中，
1. 從「資料儲存庫位置」清單中選取值。
2. 在「Your data store name」(資料儲存庫名稱) 欄位中輸入名稱。系統會產生 ID。使用資料儲存庫生成有憑有據的回覆時，請使用這個 ID。詳情請參閱「使用資料存放區產生有根據的回覆」。
3. 點選「建立」。

文件

從 Google Cloud 控制台開啟「建立資料儲存庫」頁面。
在「Cloud Storage」方塊中，按一下「選取」。
系統會顯示「從 Cloud Storage 匯入資料」窗格。
在「非結構化文件 (PDF、HTML 和 TXT 等)」部分，選取「非結構化文件 (PDF、HTML 和 TXT 等)」。
選取「同步頻率」選項。
選取「Select a folder or a file you want to import」(選取要匯入的資料夾或檔案) 選項，然後在欄位中輸入路徑。
按一下「繼續」。
系統會顯示「設定資料儲存庫」窗格。
在「設定資料儲存庫」窗格中，
1. 從「資料儲存庫位置」清單中選取值。
2. 在「Your data store name」(資料儲存庫名稱) 欄位中輸入名稱。系統會產生 ID。
3. 如要為文件選取剖析和分塊選項，請展開「文件處理選項」部分。如要進一步瞭解不同剖析器，請參閱「剖析文件」。
4. 點選「建立」。
點選「建立」。

根據資料儲存庫生成有憑有據的回覆

請按照下列操作說明，使用資料做為模型基礎。最多支援 10 個資料儲存區。

如果不知道資料儲存庫 ID，請按照下列步驟操作：

前往 Google Cloud 控制台的「AI Applications」頁面，然後點按導覽選單中的「Data Stores」(資料儲存庫)。

前往「資料儲存庫」頁面
點按資料儲存庫的名稱。
在資料儲存庫的「資料」頁面中，取得資料儲存庫 ID。

控制台

如要使用Google Cloud 控制台中的 Vertex AI Studio，將模型輸出內容與 AI 應用程式連結，請按照下列步驟操作：

前往 Google Cloud 控制台的「Vertex AI Studio Freeform」頁面。
前往「任意形式」
如要開啟「以您的資料建立基準」功能，請按一下「以您的資料建立基準」切換鈕。
按一下「自訂」。
1. 選取「Vertex AI Search」做為來源。
2. 使用這個路徑格式，將資料儲存庫的專案 ID 和資料儲存庫的 ID 替換為：
  
  projects/project_id/locations/global/collections/default_collection/dataStores/data_store_id.
按一下 [儲存]。
在文字方塊中輸入提示，然後按一下「提交」。

提示回覆會以 AI 應用程式為依據。

Python

安裝

pip install --upgrade google-genai

詳情請參閱 SDK 參考說明文件。

設定環境變數，透過 Vertex AI 使用 Gen AI SDK：

# Replace the `GOOGLE_CLOUD_PROJECT` and `GOOGLE_CLOUD_LOCATION` values
# with appropriate values for your project.
export GOOGLE_CLOUD_PROJECT=GOOGLE_CLOUD_PROJECT
export GOOGLE_CLOUD_LOCATION=global
export GOOGLE_GENAI_USE_VERTEXAI=True

from google import genai
from google.genai.types import (
    GenerateContentConfig,
    VertexAISearch,
    Retrieval,
    Tool,
    HttpOptions,
)

client = genai.Client(http_options=HttpOptions(api_version="v1"))

# Replace with your Vertex AI Search data store details
DATA_STORE_PATH = "projects/PROJECT_ID/locations/global/collections/default_collection/dataStores/DATA_STORE_ID"

tool = Tool(
    retrieval=Retrieval(
        vertex_ai_search=VertexAISearch(
            data_store=DATA_STORE_PATH
        )
    )
)

response = client.models.generate_content(
    model="gemini-2.5-flash",  # Or another supported model
    contents="What information can you find about topic X in the provided documents?", # Your query
    config=GenerateContentConfig(
        tools=[tool],
    ),
)

print(response.text)

REST

如要使用 Vertex AI API 測試文字提示，請將 POST 要求傳送至發布商模型端點。

使用任何要求資料之前，請先替換以下項目：

LOCATION：處理要求的區域。如要使用 global 端點，請從端點名稱中排除位置，並將資源位置設為 global。
PROJECT_ID：您的專案 ID。
MODEL_ID：多模態模型的模型 ID。
PROMPT：要傳送給模型的提示。

HTTP 方法和網址：

POST https://LOCATION-aiplatform.googleapis.com/v1beta1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/MODEL_ID:generateContent

JSON 要求主體：

{
  "contents": [{
    "role": "user",
    "parts": [{
      "text": "PROMPT"
    }]
  }],
  "tools": [{
    "retrieval": {
      "vertexAiSearch": {
        "datastore": projects/PROJECT_ID/locations/global/collections/default_collection/dataStores/DATA_STORE_ID
      }
    }
  }],
  "model": "projects/PROJECT_ID/locations/LOCATION/publishers/google/models/MODEL_ID"
}

如要傳送要求，請展開以下其中一個選項：

curl (Linux、macOS 或 Cloud Shell)

注意： 下列指令假設您已執行 gcloud init 或 gcloud auth login，透過使用者帳戶登入 gcloud CLI，或使用 Cloud Shell，自動登入 gcloud CLI。您可以執行 gcloud auth list 查看目前有效的帳戶。

將要求主體儲存在名為 request.json 的檔案中，然後執行下列指令：

curl -X POST \
     -H "Authorization: Bearer $(gcloud auth print-access-token)" \
     -H "Content-Type: application/json; charset=utf-8" \
     -d @request.json \
     "https://LOCATION-aiplatform.googleapis.com/v1beta1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/MODEL_ID:generateContent"

PowerShell (Windows)

注意： 下列指令假設您已執行 gcloud init 或 gcloud auth login，透過使用者帳戶登入 gcloud CLI。您可以執行 gcloud auth list 查看目前有效的帳戶。

將要求主體儲存在名為 request.json 的檔案中，然後執行下列指令：

$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }

Invoke-WebRequest `
    -Method POST `
    -Headers $headers `
    -ContentType: "application/json; charset=utf-8" `
    -InFile request.json `
    -Uri "https://LOCATION-aiplatform.googleapis.com/v1beta1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/MODEL_ID:generateContent" | Select-Object -Expand Content

您應該會收到如下的 JSON 回應：

{
  "candidates": [
    {
      "content": {
        "role": "model",
        "parts": [
          {
            "text": "You can make an appointment on the website https://dmv.gov/"
          }
        ]
      },
      "finishReason": "STOP",
      "safetyRatings": [
        "..."
      ],
      "groundingMetadata": {
        "retrievalQueries": [
          "How to make appointment to renew driving license?"
        ],
        "groundingChunks": [
          {
            "retrievedContext": {
              "uri": "https://vertexaisearch.cloud.google.com/grounding-api-redirect/AXiHM.....QTN92V5ePQ==",
              "title": "dmv"
            }
          }
        ],
        "groundingSupport": [
          {
            "segment": {
              "startIndex": 25,
              "endIndex": 147
            },
            "segment_text": "ipsum lorem ...",
            "supportChunkIndices": [1, 2],
            "confidenceScore": [0.9541752, 0.97726375]
          },
          {
            "segment": {
              "startIndex": 294,
              "endIndex": 439
            },
            "segment_text": "ipsum lorem ...",
            "supportChunkIndices": [1],
            "confidenceScore": [0.9541752, 0.9325467]
          }
        ]
      }
    }
  ],
  "usageMetadata": {
    "..."
  }
}

瞭解回覆內容

這兩個 API 的回覆都會包含 LLM 生成的文字，稱為「候選項目」。如果模型提示成功參照資料來源，回覆就會包含參照中繼資料，指出回覆中衍生自資料的部分。不過，這類中繼資料可能因多種原因而未提供，導致系統無法根據中繼資料生成提示回應。可能原因包括來源關聯性低，或是模型回覆中資訊不完整。

輸出資料的細目如下：

角色：指出已建立基準答案的傳送者。由於回覆一律包含有根據的文字，因此角色一律為 model。
文字：LLM 生成的依據答案。
建立基準中繼資料：建立基準來源的相關資訊，包含下列元素：
- 基礎塊：索引中的結果清單，可支援答案。
- 建立基準支援：答案中特定聲明相關資訊，可用於顯示引文：
- 區段：模型回覆中由基礎事實塊佐證的部分。
- 基礎事實區塊索引：基礎事實區塊清單中的基礎事實區塊索引，對應這項聲明。
- 信心分數：介於 0 到 1 之間的數字，表示聲明在所提供的基礎區塊集中，有多大程度的根據。不適用於 Gemini 2.5 以上版本。

後續步驟

如要瞭解如何傳送即時通訊提示要求，請參閱多輪對話。
如要瞭解負責任的 AI 最佳做法和 Vertex AI 的安全篩選器，請參閱「安全最佳做法」。