依文件層級關聯性篩選搜尋結果

在 Vertex AI Search 應用程式中搜尋時,您可以套用相關性門檻,讓系統只傳回符合門檻的文件做為結果。本頁說明如何指定關聯性門檻,減少查詢傳回的文件數量。

依文件層級關聯性篩選

搜尋查詢傳回的每份文件都會獲得相關程度,指出傳回的文件與查詢的相關性。透過 API 呼叫進行查詢時,您可以設定關聯性門檻。設定較高的關聯性門檻可減少查詢傳回的文件數量。

舉例來說,如果搜尋結果傳回太多與使用者不相關的文件,請將相關性門檻設為「高」,這樣搜尋結果只會顯示最相關的少數文件。如果「高」設定過於嚴格,請嘗試「中」設定。

文件層級關聯性篩選器支援的資料類型和應用程式

文件層級關聯性篩選器可套用至含有下列類型資料的資料庫:

  • 具備進階網站索引建立功能的網站資料
  • 自訂非結構化資料
  • 自訂結構化資料

文件層級相關性篩選器不適用於具有基本網站索引、媒體資料或醫療保健資料的資料儲存庫。

此外,文件層級相關性篩選器不適用於混合搜尋應用程式。混合搜尋應用程式是指連結至多個資料儲存庫的應用程式。

其他類型的篩選器

文件層級相關性篩選器並非篩選查詢傳回資料的唯一方式。您也可以使用篩選運算式,根據中繼資料 (在進階網站索引和含有中繼資料的非結構化資料儲存庫中) 和欄位值 (在結構化資料儲存庫中) 篩選結果。

詳情請參閱:

如果同時使用篩選運算式和文件層級關聯性篩選器,系統會先對結果套用篩選運算式,然後再套用文件層級關聯性篩選器。

事前準備

請確認您已建立應用程式和資料儲存庫,並將資料擷取至資料儲存庫。詳情請參閱「建立搜尋應用程式」。另請參閱「文件層級相關性篩選器支援的資料類型和應用程式」。

如要依相關性篩選,請按照下列步驟操作:

  1. 找出應用程式 ID。如果已有應用程式 ID,請跳到下一個步驟。

    1. 前往 Google Cloud 控制台的「AI Applications」頁面。

      前往「應用程式」

    2. 在「應用程式」頁面中,找出應用程式名稱,然後從「ID」欄取得應用程式的 ID。

  2. 如要依文件層級相關性篩選搜尋結果,請使用 relevanceThreshold 欄位和 engines.servingConfigs.search 方法。

    curl -X POST -H "Authorization: Bearer $(gcloud auth application-default print-access-token)" \
    -H "Content-Type: application/json" \
    "https://discoveryengine.googleapis.com/v1alpha/projects/PROJECT_ID/locations/global/collections/default_collection/engines/APP_ID/servingConfigs/default_search:search" \
    -d '{
     "servingConfig": "projects/PROJECT_ID/locations/global/collections/default_collection/engines/APP_ID/servingConfigs/default_search",
    "query": "QUERY",
    "relevanceThreshold": "RELEVANCE_THRESHOLD"
    }'
    

    更改下列內容:

    • PROJECT_ID:您的 Google Cloud 專案 ID。
    • APP_ID:要查詢的 Vertex AI Search 應用程式 ID。
    • QUERY:要搜尋的查詢文字。
    • RELEVANCE_THRESHOLD:下列其中一項:HIGHMEDIUMLOWLOWEST
  3. 使用不同門檻測試多個查詢,找出最適合資料和應用程式的門檻設定。