上次更新日期:2026 年 1 月 14 日
模糊搜尋是一種搜尋技術,即使搜尋查詢與對應資料不完全相符,也能找出符合的結果。這項功能不僅會比對字面上的每個字元,還會識別拼寫、意義或其他條件上與搜尋查詢相似的結果。這項功能在處理使用者輸入內容時特別實用,因為整體而言,使用者在溝通時會採用不同的方式,所以使用者輸入的內容可能包含錯字、變化 (例如複數與單數、縮寫、詞幹等),以及其他不一致的內容。
假設您在資料庫中搜尋「apple」,較簡單的搜尋引擎可能只會傳回與「apple」一字完全相符的項目。不過,如果引擎採用模糊搜尋,就會將「apples」、「appel」或「aplle」等類似字詞視為潛在相符項目,即使拼字略有不同也沒關係。
這種做法可擴大搜尋範圍,即使使用者在查詢中拼錯字,也能提高找到相關資訊的機率。這就如同撒網捕魚,不僅能捕獲您要的魚,也能捕獲與目標相似的魚。
在資料可能不一致,或使用者不確定要搜尋內容的確切拼法時,模糊搜尋功能可能會發揮效用。這項功能在電子商務領域特別實用,可用於找出名稱略有差異的產品,或在大型資料集中派上用場,因為手動資料清理在其中是不切實際的方法。
可用於建構及執行模糊搜尋的 Google Cloud 產品包括 Vertex AI、Cloud SQL 和 Cloud Spanner。如要瞭解模糊搜尋是否符合您的需求,請與我們的銷售團隊聯絡,或是開始免費試用。
模糊搜尋會採用各種演算法和技術,判斷兩個字串 (搜尋查詢和資料中的潛在相符項目) 的相似度。這些演算法通常會運用下列概念:
模糊搜尋引擎會運用這類概念,根據潛在相符結果與原始查詢的相似度進行排名,協助使用者查看一系列相關結果,即使這些結果與搜尋字詞略有不同也無妨。
隨著資料集規模擴大,使用者輸入內容也變得更多元,模糊搜尋提供了一種有效擷取資訊的寶貴方法。這項技術可協助消弭使用者溝通 (或搜尋) 方式與資料結構化及儲存方式之間的落差。
以下說明模糊搜尋的重要性:
精確搜尋和模糊搜尋的根本差異在於處理資料變化的做法。以下是兩者的主要差異:
精確搜尋 | 模糊搜尋 | |
符合條件 | 必須與每個字元完全相符 | 允許輸入錯字、變化和部分相符的關鍵字 |
搜尋範圍 | 範圍較窄,只傳回精確的比對結果 | 範圍較廣,可擷取更多的結果 |
用途 | 需要嚴格準確性的情境,例如高度管制產業的產品目錄或資料庫 | 需要具備彈性和容錯能力的情境,例如大型網站的搜尋列 |
精確搜尋
模糊搜尋
符合條件
必須與每個字元完全相符
允許輸入錯字、變化和部分相符的關鍵字
搜尋範圍
範圍較窄,只傳回精確的比對結果
範圍較廣,可擷取更多的結果
用途
需要嚴格準確性的情境,例如高度管制產業的產品目錄或資料庫
需要具備彈性和容錯能力的情境,例如大型網站的搜尋列
為了說明模糊搜尋的實際應用,我們來看看幾個例子,瞭解這項技術如何根據不同搜尋查詢背後的使用者意圖,提供相關的搜尋結果。
在這種情況下,即使有錯字,模糊搜尋演算法也能辨識使用者的意圖,並提供想要的蘋果派食譜。這種演算法可以理解「aple」可能是「apple」的拼字錯誤,並優先顯示相關結果。
模糊搜尋可流暢處理複數變化。無論使用者搜尋單數或複數形式,搜尋引擎都會智慧擷取符合預期意義的結果,確保使用者無論採用哪種文法形式,都能找到食譜。
能解讀同義詞,擴大搜尋範圍。搜尋引擎會辨識出「快速料理點子」和「簡單晚餐食譜」這兩個概念相似的關鍵字,並為兩者提供相關結果,讓搜尋結果的可能性不必侷限於字面上所用的關鍵字。
演算法通常會採用詞幹提取技術,將字詞縮減為共同詞幹或字根形式。因此即使字詞的語法不同,搜尋結果仍會將「running shoes」和「run shoe」視為同義詞,確保使用者能找到相關產品,不受字詞略有不同的影響。
系統能有效處理縮寫,並辨識出「USA」指的是「United States of America」。這項功能特別適合用於資料庫和搜尋引擎,因為這類應用經常使用縮寫來縮短字詞。
導入模糊搜尋功能通常涉及下列步驟:
具體做法可能因應用程式而異,但 Google Cloud 的 Vertex AI 可在機器學習工作流程中,運用模糊搜尋技術,提高模型準確度,並處理雜訊或不一致的資料。舉例來說,模糊比對可將類似的資料點分組,或找出並修正訓練資料集中的錯誤,進而強化特徵工程。