監督式學習與非監督式學習有何差異?

人工智慧機器學習訓練作業中,最常採用的兩種主要做法為監督式和非監督式學習。監督式和非監督式學習最簡單的區分方法,就是模型訓練方式,以及演算法使用的訓練資料類型。

然而,監督式學習與非監督式學習之間仍有一些其他差異,因此機構必須根據特定目標和業務目標選擇較合適的做法。

本文將介紹監督式和非監督式機器學習技術的主要差異,協助您瞭解哪些做法最符合您的需求。

新客戶最多可獲得價值 $300 美元的免費抵免額,盡情體驗 Vertex AI 和其他 Google Cloud 產品。

免費試用

監督式學習與非監督式學習的差異

監督式和非監督式機器學習技術最大的差異在於使用的資料類型。監督式學習會使用已加上標籤的訓練資料,非監督式學習則不會。

簡單來說,監督式學習模型需要對正確的輸出值「擁有」基本瞭解。

使用監督式學習模型時,演算法會使用範例資料集來訓練並進行預測,然後反覆調整盡可能減少錯誤。這些資料集會加上內容標籤,並提供所需的輸出值,讓模型產生「正確」的答案。

相較之下,非監督式學習演算法則會獨立運作,在沒有特定指引或指示的情況下學習資料的固有結構。您只需要提供未加上標籤的輸入資料,讓演算法找出資料集中自然產生的模式即可。

儘管不同資料類型是區分這兩種模型的最簡單方法,但兩種模型具有不同的目標和應用程式,也各有特色。

監督式學習模型更著重於學習輸入和輸出資料之間的關係。舉例來說,監督式模型可根據特定參數 (例如天氣狀況、機場路況、航班尖峰時段等) 預測航班時間。

另一方面,非監督式學習則較適合在未加上標籤的原始資料中,發掘新的模式和關係。舉例來說,非監督式學習模型可用於辨識同時購買相關產品的買家族群,以便提供其他產品建議給類似客戶的。

因此,監督式和非監督式機器學習可以解決的問題類型不同。監督式機器學習適合用於分類和迴歸工作,例如天氣預測、價格變更、情緒分析和垃圾郵件偵測。而非監督式學習較常用於探索性資料分析和任務分群,例如異常偵測、大數據視覺化或客戶區隔。

如何選擇監督式學習和非監督式學習

現在您已瞭解監督式和非監督式學習的差異,哪種做法適合您呢?

選擇合適的做法時,需視整體目標和需求、希望解決的問題,以及貴團隊分析、處理及管理資料的整體做法而定。

一般來說,在選擇最適合貴機構的做法時,需要考量下列事項。

  • 您的資料是否已加上標籤?監督式學習需要使用加上標籤的資料集。您必須評估貴機構是否有時間、資源及專業知識能驗證資料並加上標籤。
  • 您的目標是什麼?請務必考量您想解決的問題類型,以及您要建立預測模型,還是想探索新的深入分析結果或資料中的隱藏模式。
  • 您需要哪些類型的演算法?在選擇最適合貴機構的做法時,也請務必評估演算法能否支援大量資料並符合所需維度,例如特徵和屬性的數量。

選擇監督式與非監督式學習的重點在於您要解決的問題、您能取得的資料,以及您是否擁有建立和管理模型所需的工具和經驗。

什麼是半監督式學習?

不確定這兩個選項是否適合嗎?您也可以考慮採用第三種做法:半監督式學習。

半監督式學習結合了監督式學習和非監督式學習的各個層面。這個類別的機器學習技術會同時使用已加上標籤和未加上標籤的資料來訓練預測模型。

半監督式學習會使用少量已加上標籤的資料來訓練初始模型,這種模型可用來預測大量未加上標籤的資料標籤,然後將模型反覆套用至原先加上標籤的資料與含有預測標籤的資料 (虛擬標籤)。之後,您需要將最準確的預測新增至已加上標籤的資料集,並重複執行該程序,持續改善模型效能。

透過 Google Cloud 解決業務難題

新客戶可以獲得價值 $300 美元的免費抵免額,盡情試用各項 Google Cloud 功能。
與 Google Cloud 銷售專員聯絡,深入探討您面臨的特殊難題。

展開下一步行動

運用價值 $300 美元的免費抵免額和超過 20 項一律免費的產品,開始在 Google Cloud 中建構產品與服務。

Google Cloud
  • ‪English‬
  • ‪Deutsch‬
  • ‪Español‬
  • ‪Español (Latinoamérica)‬
  • ‪Français‬
  • ‪Indonesia‬
  • ‪Italiano‬
  • ‪Português (Brasil)‬
  • ‪简体中文‬
  • ‪繁體中文‬
  • ‪日本語‬
  • ‪한국어‬
控制台
Google Cloud