什麼是全文搜尋？

全文搜尋是一種技巧，可在一個大型的文字語料庫中尋找特定資訊。這項功能不僅僅是關鍵字比對，還會分析文件內容，根據使用者的搜尋查詢找出相關結果。

Google Cloud 產品可以協助您運用全文搜尋功能，這些產品包括 Vertex AI Search、Natural Language AI 和 Vision AI。如要探索符合您需求的全文搜尋解決方案，請與我們的銷售團隊聯絡或開始免費試用。

免費試用

全文搜尋功能的運作方式為何？

全文搜尋包含兩個主要階段：索引和搜尋，前者就像建立資料庫的地圖，而後者就是從這個地圖中擷取要求的資訊。

索引功能

在索引建立階段，系統會分析文件的文字內容，並以結構化格式儲存資料。這項程序通常包括：

斷詞：將文字拆分為個別字詞或稱為「詞元」的單位，就像將句子分割成個別字詞一樣。
詞幹分析：將字詞刪減至字根形式，例如將「running」減至「run」。這可確保在搜尋時，系統會將同一個字詞的變化視為單一字詞。
去除停用詞：移除對搜尋沒有特別意義的常見字詞，例如「the」、「a」和「is」。這有助於縮減索引大小並提升搜尋速度。
建立索引：建立資料結構，將關鍵字對應到文件中的位置。此索引可做為藍圖，方便搜尋引擎快速找到相關文件。

建立索引的程序對全文搜尋系統的效能十分重要。結構良好的索引可快速有效地擷取相關文件，即使在大型資料集內也沒問題。

搜尋中

建立索引後，搜尋階段可讓使用者提交查詢並擷取相關結果。系統會分析搜尋查詢，並使用索引找出包含相關關鍵字的文件。

執行搜尋時，系統不會只尋找完全相符的關鍵字，而是也會運用多種技巧來提高搜尋結果的關聯性。舉例來說，系統會考量文件內關鍵字的相關性，或內容與查詢的關聯性。

全文搜尋方法

搜尋全文有許多方法，有多種方法，每種方法都具有其獨特的功能，可能更適合不同的需求。常見的方法有：

基本搜尋

這種簡單的搜尋方法會比對文件中的關鍵字，不考慮順序或遠近。例如，搜尋「cat」和「dog」會傳回含有任一字詞的文件。

基本搜尋相當簡單，適合簡單的搜尋情境，通常所需的運算能力較少，但有時可能會傳回大量不相關的結果，尤其是在關鍵字很常見的情況下。

模糊搜尋

模糊搜尋是更有彈性的方法，可以輸入拼字或錯字等變化。這個模式會考量字詞相似度等因素，讓使用者能夠找出內含略微不同字詞的文件，例如「cat」和「cats」。

想想使用者在論壇中討論「programing」秘訣。當您使用標準方式搜尋「programming」時，可能會因為拼寫錯誤或錯字，而錯過論壇內容。然而，模糊搜尋會將「programing」視為近似變體，確保在搜尋結果中包含這類相關內容。

鄰近搜尋

鄰近搜尋可讓使用者指定關鍵字之間的鄰近程度。舉例來說，搜尋「cat NEAR Dog」就會傳回單字「cat」與「dog」距離很近的文件。

想像一下，您需要處理資料和內容的歷來封存檔。只要設定在全文搜尋中使用鄰近度方法，就能設定應用程式，協助研究人員更快找出有關特定關係的文件。搜尋「Abraham Lincoln /3 Mary Todd」會優先處理「Abraham Lincoln」與「Mary Todd」距離很近的文件。這樣，系統傳回的結果就更可能包含有關兩者關係的資訊，而不是顯示分別提及各項的不同文件。

如果文件與搜尋字詞之間的關係很重要，這個方法就特別實用。

全文搜尋的優點

全文搜尋功能有許多優點，對各種應用程式而言是相當實用的工具。

提升搜尋效率

全文搜尋功能可分析整份文件內容，加快擷取相關資訊的速度，大幅提升搜尋效率，對大型資料集來說特別有用。

更佳的使用者體驗

全文搜尋功能可讓使用者輕鬆快速地找出所需資訊，進而提升整體使用者體驗。

開發人員和從業人員可以針對特定用途 (例如電子商務網站) 微調全文搜尋引擎，確保使用者能夠快速取得正確、相關且快速的搜尋結果。

精準度更高

相較於更簡單的搜尋方法，全文搜尋的精確度更高。這種方法會考量字詞鄰近度和語意含義等因素，有助於擷取更多相關資料，並減少偽陽性的情形。

如何執行全文搜尋？

實作全文搜尋系統的過程涉及一系列的步驟，包括選擇適當工具、進行效能最佳化等。具體的實作方式可能因資料集大小、效能需求和預算等因素而異。然而，可以歸納出一個通用的方法。

選擇全文搜尋引擎：根據您的需求，然後考量資料集大小、成效需求、預算限制和想要使用的功能等因素，選取適合的搜尋引擎。我們提供各式各樣的方案，包括開放原始碼解決方案 (例如 Elasticsearch、Apache Solr) 和代管雲端服務 (例如 Google Cloud Search)。
為資料建立索引：準備資料，以進行有效率地搜尋。這包括針對您選擇的搜尋引擎，以最適合您使用的格式建構及儲存資料。步驟可能包含資料轉換 (例如文字擷取、清理、正規化)、使用中繼資料充實資料，以及定義搜尋結構定義 (指定建立資料的索引方式，包括欄位、資料類型和排名權重)。
實作搜尋功能：設計用來提交搜尋查詢及顯示結果的使用者介面。設定搜尋引擎以有效處理使用者查詢，可能需要實作查詢剖析、字根識別、同義詞辨識和關聯性排名等功能，以確保取得準確且相關的結果。
效能最佳化：確保系統能有效率地處理搜尋要求，尤其是針對大型資料集或高流量的情況。這些技巧包括快取經常存取的結果、最佳化搜尋索引結構，以及微調搜尋引擎設定參數。定期監控效能，並視需要進行調整。
維護和更新：實作全文搜尋時，請務必持續留意。根據新資料定期更新索引、分析搜尋記錄以找出有待改進的部分，以及修正搜尋演算法與排名因素，藉此提高準確率與關聯性。這樣即可確保系統持續有效，且能隨著時間提供良好的使用者體驗。

全文搜尋的應用

全文搜尋廣泛應用於不同產業與領域。

內容管理系統

全文搜尋功能常用於內容管理系統 (CMS)，讓使用者能在大量的內容中搜尋特定資訊。這項功能可方便您在網站或知識庫中尋找文章、文件和其他內容。

舉例來說，新聞網站可能會使用全文搜尋功能，讓使用者找到與特定活動或主題相關的報導。

電子商務

全文搜尋功能有助於進階使用者在電子商務網站上進行搜尋，特別是擁有大量產品目錄和詳細說明的網站。購物者在前端輸入他們想找的內容，但是在幕後，文字搜尋引擎會分析產品說明、規格甚至使用者評論，藉此找出最相關的商品。

社群媒體監控

全文搜尋功能可在社群媒體監控工具中，用於追蹤在各種社群媒體平台上提及特定品牌、產品或主題的情況，這有助於機構進一步瞭解大眾的觀點，以及找出潛在問題。

分析社群媒體貼文的內容，可讓商家有機會進一步瞭解客戶意見和偏好。參考這些資訊有助於改善產品和服務、回答客戶疑慮，以及找出新興趨勢。

展開下一步行動

運用價值 $300 美元的免費抵免額和超過 20 項一律免費的產品，開始在 Google Cloud 中建構產品與服務。

免費試用

需要入門協助嗎？
聯絡銷售人員
與值得信賴的夥伴合作
尋找合作夥伴
繼續瀏覽
查看所有產品

什麼是全文搜尋？

全文搜尋功能的運作方式為何？

索引功能

搜尋中

全文搜尋方法

基本搜尋

模糊搜尋

鄰近搜尋

全文搜尋的優點

提升搜尋效率

提升搜尋效率

更佳的使用者體驗

更佳的使用者體驗

精準度更高

精準度更高

如何執行全文搜尋？

全文搜尋的應用

內容管理系統

電子商務

社群媒體監控

相關的 Google Cloud AI 產品和服務

展開下一步行動

需要入門協助嗎？

與值得信賴的夥伴合作

繼續瀏覽