本頁說明如何設定結構化資料、含中繼資料的非結構化資料,或含自訂結構化屬性的網站資料的應用程式,並設定架構欄位。
欄位設定有助於決定 Vertex AI Search 如何在結果中使用欄位。您可以在控制台的「結構定義」分頁中設定欄位。Google Cloud
只有包含結構化資料或含有中繼資料的非結構化資料的資料儲存庫,才能設定欄位。
欄位設定
搜尋或建議資料中的許多欄位類型都提供下列欄位設定,但並非所有資料類型都適用。結構定義包含個別欄位的多個欄位設定,下表則列出可套用至結構定義中欄位的設定。強烈建議使用結構化資料來設定下列欄位:
設定 | 定義 | 目的 | 應用實例範例 |
---|---|---|---|
可建立索引 | 將欄位設為可建立索引,即可對文件中的結構化欄位執行篩選、提升和分面等作業。 類型為 |
將欄位標示為 請注意,將欄位標示為 | 在飯店資料儲存庫中,您可以將 hotel_chain 等欄位設為可建立索引。這樣一來,您就能對 hotel_chain 執行排名、篩選和提升作業。舉例來說,您可以套用篩選器,讓搜尋結果只顯示包含篩選飯店連鎖的結果。 |
可供搜尋 | 最有可能與搜尋相關的欄位會指定為 只有內含文字值的欄位可以標示為可搜尋。因此,數字價格欄位可編入索引 (用於篩選或切面),但無法以全文搜尋。 | 將欄位設為「可搜尋」可提高搜尋查詢中該欄位的召回率,讓使用者透過查詢這些欄位中的文字,尋找網頁等內容。將欄位標示為可供搜尋,即可套用排名。因此,如果將過多欄位標示為可搜尋,可能會導致排名演算法過度飽和,傳回過多結果,進而對搜尋精確度造成負面影響。這可能會導致搜尋結果不相關。 | 網際網路服務供應商的支援票證系統會將每張票證儲存為結構化文件。如果這些文件包含可搜尋的文字欄位 (例如 |
可使用動態 facet | 提供情境感知篩選器,在搜尋中更精準地鎖定使用者。將欄位設為 Dynamic Facetable ,系統就能根據欄位中的不重複值,自動產生互動式篩選器 (切面)。 | 將欄位設為 Dynamic
facetable 後,使用者就能直接選取從已擷取資料衍生而來的類別或屬性,動態調整搜尋結果,不必手動預先定義所有可能的篩選選項。使用者可以藉此將搜尋範圍縮小至非常具體的網頁內容。 | 系統會擷取公司內部知識庫中的網頁 (例如人資政策),並搭配 department 、document_type 或 last_modified_date 等資料。如果這些欄位標記為 dynamic facetable ,員工搜尋「費用報銷」等字詞時,系統會根據找到的相關結果動態產生互動式篩選器。在這種情況下,網頁介面可能會顯示「部門:財務、旅遊」、「文件類型:政策、常見問題」或「上次修改日期:本季、去年」等層面。 |
可擷取 | 當搜尋查詢命中相符內容時,搜尋引擎可以提取可擷取欄位的值,以供顯示或在應用程式中使用,也就是說,原始文件中的資訊會顯示為搜尋結果的一部分。將重要欄位 (文件的專屬 ID) 設為可擷取。 | 可擷取的欄位會區分可顯示值的欄位,以及僅用於搜尋邏輯但原始值不應向使用者顯示的欄位,藉此提供搜尋環境。 | 在商家網站上搜尋產品時,product_id 、name 、price 和 image_url 通常是您想設為可擷取的欄位。另一方面,internal_tracking_code 只能編入索引,並僅供管理用途篩選,不會顯示在公開搜尋結果中。 |
可完成 | 允許將欄位內容做為搜尋查詢建議。詳情請參閱「設定自動完成功能」。 | 這項設定可讓系統在使用者輸入內容時,使用該欄位中的值提供即時查詢建議。這項功能可引導使用者找到相關內容,並加快搜尋過程。某些因素 (例如使用自然語言篩選功能) 可能會影響這項效能。 | 如果為 product_name 、brand 和 category 設定 completable 欄位,當使用者輸入「技術」時,自動完成建議會顯示:
|
可篩選 | 允許建議功能使用欄位篩選建議結果,決定使用者看到的搜尋結果。如要瞭解如何篩選建議,請參閱「篩選建議」。 | 將欄位設為 Filterable 有助於為使用者自訂建議。請注意,這會受到篩選限制。 |
依語言和戲劇篩選的設定可能如下所示:language_code: ANY("en", "fr") OR categories: ANY("drama") 。 |
常用設定的差異
可建立索引、可供搜尋和可擷取的欄位設定之間有主要差異。下表摘要列出這些差異。
功能 | 可建立索引 | 可供搜尋 | 可擷取 |
---|---|---|---|
主要角色 | 讓搜尋引擎可存取欄位內容 | 允許對欄位內容進行全文查詢 | 允許在搜尋結果中傳回欄位值 |
分析 | 系統會處理內容並建立索引。 | 通常會經過廣泛的詞彙分析。 | 系統會照原樣儲存值,以供顯示。 |
可以...嗎? | |||
...是否可供搜尋? | 是 (通常是先決條件) | 不適用 | 不一定 (可擷取,但無法搜尋) |
...可擷取? | 不一定 | 不一定 | 不適用 |
...Filterable/Sortable/Facetable? | 是 (通常也是這些項目的先決條件) | 無法直接建立,這些是獨立屬性,通常以可建立索引的欄位為基礎。 | 不會直接影響,這些屬性與欄位的索引和查詢方式有關,而不只是顯示方式。 |
在實務上,許多對使用者體驗至關重要的欄位 (例如標題、說明和識別資訊) 通常會設為 indexable
、searchable
和 retrievable
。
限制
欄位設定有下列限制:
- 您最多可以將 50 個欄位設為可建立索引、可搜尋或動態商情項目。
- 您最多可以將 30 個欄位設為可擷取。
- 如要將欄位設為動態商情項目,必須先將其設為可建立索引。
- 如要變更可建立索引的設定,您必須重新建立資料索引。這項作業可能需要數小時,尤其是大型資料儲存庫。
如果您要為媒體搜尋應用程式設定欄位,並想瞭解架構中的欄位詳細資訊,請參閱「關於媒體文件和資料存放區」。
更新欄位設定
如要更新欄位設定,請按照下列步驟操作:
前往 Google Cloud 控制台的「AI Applications」頁面。
按一下要編輯的應用程式名稱。
按一下 [Data] (資料)。
按一下 [Schema] (結構定義) 分頁標籤。這個分頁會顯示目前的欄位設定。
按一下 [編輯]。
選取或清除需要更新的欄位設定。系統不支援部分欄位設定。舉例來說,數值型欄位無法設為「可搜尋」。
按一下 [Save] (儲存) 套用您的變更。