本頁說明擷取和排序如何共同運作,在 Vertex AI Search 應用程式中提供相關搜尋結果。
總覽
簡而言之,擷取是尋找相關文件,而排名則是排序這些擷取的文件。對所有可用文件進行排序的運算成本可能很高。因此,檢索和排名作業會依序執行。
首先,搜尋模型會瞭解查詢內容並重新編寫。然後,模型會根據可用的資料來源和資料儲存庫中已建立索引的文件數量,擷取數千份文件。系統會為擷取的文件指派關聯性分數。
然後,排名模型會排序擷取的檔案,並提供排名前 400 的結果。下圖說明這兩個程序如何融入搜尋工作流程。
擷取方法
檢索是指從資料存放區中選取與使用者查詢相關的文件子集。Vertex AI Search 模型會根據不同信號 (例如下列信號) 管理搜尋應用程式的擷取作業,並指派相關分數:
主題性:包括關鍵字比對、知識圖譜和網路信號。
嵌入:包括嵌入,可尋找概念相似的內容。
交叉注意力:模型可考量查詢和文件之間的關係,為文件指派關聯性分數。
新舊程度:判斷資料商店中文件的存在時間。
使用者事件:包括用於個人化的轉換信號。
此外,在搜尋要求中,您可以提供相關性篩選器和網站資料的元資料篩選器,以及結構化或非結構化資料,縮小相關文件清單的範圍。
排名方式
排序會採用擷取階段選取的文件,並根據下列條件指派新的關聯性分數,然後重新排序:
- 提高排名:根據自訂屬性或新鮮度,提高或降低特定結果的排名。這會影響前 1,000 份擷取的文件,並為前 400 份文件排序。 詳情請參閱「提升搜尋結果」。
- 自訂排名:控管、調整及覆寫預設排名邏輯,並使用以公式為基礎的排名演算法,滿足特定需求。在提供結果時,自訂排名指派的關聯性分數會優先採用。詳情請參閱「自訂搜尋結果排名」。
- 搜尋調整:影響模型對文件語意關聯性的認知,並變更嵌入關聯性分數。詳情請參閱「運用搜尋調整功能,提升搜尋結果品質」。
- 以事件為基礎的重新排序:在提供結果時,使用以使用者事件為基礎的個人化模型更新結果。