什麼是模糊搜尋？

上次更新日期：2026 年 1 月 14 日

模糊搜尋是一種搜尋技術，即使搜尋查詢與對應資料不完全相符，也能找出符合的結果。這項功能不僅會比對字面上的每個字元，還會識別拼寫、意義或其他條件上與搜尋查詢相似的結果。這項功能在處理使用者輸入內容時特別實用，因為整體而言，使用者在溝通時會採用不同的方式，所以使用者輸入的內容可能包含錯字、變化 (例如複數與單數、縮寫、詞幹等)，以及其他不一致的內容。

假設您在資料庫中搜尋「apple」，較簡單的搜尋引擎可能只會傳回與「apple」一字完全相符的項目。不過，如果引擎採用模糊搜尋，就會將「apples」、「appel」或「aplle」等類似字詞視為潛在相符項目，即使拼字略有不同也沒關係。

這種做法可擴大搜尋範圍，即使使用者在查詢中拼錯字，也能提高找到相關資訊的機率。這就如同撒網捕魚，不僅能捕獲您要的魚，也能捕獲與目標相似的魚。

在資料可能不一致，或使用者不確定要搜尋內容的確切拼法時，模糊搜尋功能可能會發揮效用。這項功能在電子商務領域特別實用，可用於找出名稱略有差異的產品，或在大型資料集中派上用場，因為手動資料清理在其中是不切實際的方法。

可用於建構及執行模糊搜尋的 Google Cloud 產品包括 Vertex AI、Cloud SQL 和 Cloud Spanner。如要瞭解模糊搜尋是否符合您的需求，請與我們的銷售團隊聯絡，或是開始免費試用。

模糊搜尋如何運作？

模糊搜尋會採用各種演算法和技術，判斷兩個字串 (搜尋查詢和資料中的潛在相符項目) 的相似度。這些演算法通常會運用下列概念：

Levenshtein 距離：用來判斷轉換成另一個字串所需的最少編輯 (例如插入、刪除或替換) 次數。Levenshtein 距離越小，表示相似度越高。舉例來說，「kitten」和「sitting」的 Levenshtein 距離為 3。
餘弦相似度：計算代表字詞或字串的兩個向量之間的餘弦角。餘弦相似度為 1 代表完全比對，而 0 則表示完全不相似。通常用來根據文字內容比較文件。
語音演算法：這些技術 (例如 Soundex 或 Metaphone) 會根據字詞的發音編碼。這有助於找出聽起來相似的字詞，即使這些字詞的拼法不同，例如「Smith」和「Smyth」。

模糊搜尋引擎會運用這類概念，根據潛在相符結果與原始查詢的相似度進行排名，協助使用者查看一系列相關結果，即使這些結果與搜尋字詞略有不同也無妨。

為什麼模糊搜尋很重要？

隨著資料集規模擴大，使用者輸入內容也變得更多元，模糊搜尋提供了一種有效擷取資訊的寶貴方法。這項技術可協助消弭使用者溝通 (或搜尋) 方式與資料結構化及儲存方式之間的落差。

以下說明模糊搜尋的重要性：

容易使用：模糊搜尋功能可容許輸入錯字、字詞變化或拼寫錯誤，使用者不必知道確切的拼寫或措詞，也能輕鬆找到所需內容。這可以提供更流暢快速的搜尋體驗。
提升搜尋結果關聯性：模糊搜尋會考量變化和同義詞，找出更多相關結果，而完全比對搜尋可能會遺漏這些結果。
提升資料可偵測性：在可能存在資料輸入不一致或變化的大型資料集中，模糊搜尋可協助發掘隱藏的關聯，並找出可能被忽略的相關資訊。

精確搜尋和模糊搜尋有何差別？

精確搜尋和模糊搜尋的根本差異在於處理資料變化的做法。以下是兩者的主要差異：

	精確搜尋	模糊搜尋
符合條件	必須與每個字元完全相符	允許輸入錯字、變化和部分相符的關鍵字
搜尋範圍	範圍較窄，只傳回精確的比對結果	範圍較廣，可擷取更多的結果
用途	需要嚴格準確性的情境，例如高度管制產業的產品目錄或資料庫	需要具備彈性和容錯能力的情境，例如大型網站的搜尋列

精確搜尋

模糊搜尋

符合條件

必須與每個字元完全相符

允許輸入錯字、變化和部分相符的關鍵字

搜尋範圍

範圍較窄，只傳回精確的比對結果

範圍較廣，可擷取更多的結果

用途

需要嚴格準確性的情境，例如高度管制產業的產品目錄或資料庫

需要具備彈性和容錯能力的情境，例如大型網站的搜尋列

如要根據特定工作選擇合適的技術，就必須瞭解精確搜尋和模糊搜尋的差異。精確搜尋適合用於需要高精確度的情況，而模糊搜尋則擅長處理使用者輸入的變化或錯誤，並在不一致的情況下找出相關資訊。

模糊搜尋範例

為了說明模糊搜尋的實際應用，我們來看看幾個例子，瞭解這項技術如何根據不同搜尋查詢背後的使用者意圖，提供相關的搜尋結果。

Typos

使用者搜尋：「aple pie」
模糊搜尋結果：「apple pie」

在這種情況下，即使有錯字，模糊搜尋演算法也能辨識使用者的意圖，並提供想要的蘋果派食譜。這種演算法可以理解「aple」可能是「apple」的拼字錯誤，並優先顯示相關結果。

複數和單數

使用者搜尋：「recipe」
模糊搜尋結果：「recipes」

模糊搜尋可流暢處理複數變化。無論使用者搜尋單數或複數形式，搜尋引擎都會智慧擷取符合預期意義的結果，確保使用者無論採用哪種文法形式，都能找到食譜。

同義詞

使用者搜尋：「快速料理點子」
模糊搜尋結果：「簡單晚餐食譜」

能解讀同義詞，擴大搜尋範圍。搜尋引擎會辨識出「快速料理點子」和「簡單晚餐食譜」這兩個概念相似的關鍵字，並為兩者提供相關結果，讓搜尋結果的可能性不必侷限於字面上所用的關鍵字。

詞幹提取

使用者搜尋：「running shoes」
模糊搜尋結果：「run shoe」

演算法通常會採用詞幹提取技術，將字詞縮減為共同詞幹或字根形式。因此即使字詞的語法不同，搜尋結果仍會將「running shoes」和「run shoe」視為同義詞，確保使用者能找到相關產品，不受字詞略有不同的影響。

縮寫

使用者搜尋：「USA」
模糊搜尋結果：「United States of America」

系統能有效處理縮寫，並辨識出「USA」指的是「United States of America」。這項功能特別適合用於資料庫和搜尋引擎，因為這類應用經常使用縮寫來縮短字詞。

模糊搜尋的實作方式

導入模糊搜尋功能通常涉及下列步驟：

資料預先處理：這個步驟會在一定程度上清理及標準化資料。例如將文字轉換為小寫、移除標點符號，或套用詞幹提取技術。模糊搜尋可容許變化，但基本預先處理作業有助於提高效率。
建立索引：預先處理的資料會建立索引，通常會使用反轉索引或字典樹結構等專門的資料結構。這些結構可快速擷取指定查詢的潛在相符項目。
相似度計算：使用者提交查詢時，模糊搜尋演算法會計算查詢與編入索引的資料的相似度分數。這項技術會使用 Levenshtein 距離、餘弦相似度或語音演算法等演算法，將比對程度量化。
排名與擷取：系統會根據相似度分數，將可能的相符項目排名，並擷取排名最高的結果，呈現給使用者。

Vertex AI 如何運用模糊搜尋？

具體做法可能因應用程式而異，但 Google Cloud 的 Vertex AI 可在機器學習工作流程中，運用模糊搜尋技術，提高模型準確度，並處理雜訊或不一致的資料。舉例來說，模糊比對可將類似的資料點分組，或找出並修正訓練資料集中的錯誤，進而強化特徵工程。

後續行動

運用價值 $300 美元的免費抵免額和 20 多項一律免費的產品，開始在 Google Cloud 建構產品與服務。

需要入門協助嗎？
聯絡業務人員
與值得信賴的夥伴合作
尋找合作夥伴
繼續瀏覽
查看所有產品