監督式學習中使用的資料會加上標籤,表示會含有輸入 (稱為「特徵」) 和正確輸出內容 (標籤) 的範例。當要求對新資料進行預測時,演算法會分析這些訓練組合的大型資料集,推論出所需的輸出值。
舉例來說,假設您想訓練一個模型來辨識樹木圖片。您先提供了一個加上標籤的資料集,其中包含許多不同類型的樹木範例以及對應的樹種名稱。您可以讓演算法嘗試根據加上標籤的輸出結果,定義每種樹木的特徵組合。接著,您便可以測試模型:向模型展示一張樹的圖片,並要求猜測其樹種。如果模型回答錯誤,您可以繼續訓練它,並使用更多範例來調整參數,藉此提高準確率並盡量減少錯誤。
一旦訓練和測試完成,您就能使用模型,根據其先前學到的知識預測未知資料。
監督式學習中使用的資料會加上標籤,表示會含有輸入 (稱為「特徵」) 和正確輸出內容 (標籤) 的範例。當要求對新資料進行預測時,演算法會分析這些訓練組合的大型資料集,推論出所需的輸出值。
舉例來說,假設您想訓練一個模型來辨識樹木圖片。您先提供了一個加上標籤的資料集,其中包含許多不同類型的樹木範例以及對應的樹種名稱。您可以讓演算法嘗試根據加上標籤的輸出結果,定義每種樹木的特徵組合。接著,您便可以測試模型:向模型展示一張樹的圖片,並要求猜測其樹種。如果模型回答錯誤,您可以繼續訓練它,並使用更多範例來調整參數,藉此提高準確率並盡量減少錯誤。
一旦訓練和測試完成,您就能使用模型,根據其先前學到的知識預測未知資料。
機器學習中的監督式學習通常分為兩類:分類和迴歸。
分類演算法可根據輸入資料預測類別標籤或輸出變數,藉此將資料分組。分類演算法適用於輸出變數為類別的情況,表示有兩個以上的類別。
電子郵件收件匣的垃圾郵件篩選器是其中一個分類演算法最常見的例子。在此,監督式學習模型將經過包含垃圾郵件和正當郵件有標籤樣本的資料集訓練,藉此預測電子郵件是否為垃圾郵件。這個演算法會擷取每封電子郵件的相關資訊,包括寄件者、主旨行和內文等等。接著,它會利用這些特徵和對應的輸出標籤來學習模式,並給予分數,做為判斷電子郵件屬於正當或垃圾郵件的指標。
迴歸演算法可用來預測實際值或連續值,由演算法偵測兩個以上變數之間的關係。
迴歸任務的常見例子可能是依據工作經驗預測薪酬。舉例來說,監督式學習演算法將被提供與工作經驗相關的輸入資料 (例如時長、產業或領域、地點等),以及相應的薪資金額。模型訓練完成後,可用來根據工作經驗預測平均薪酬。
監督式學習模型可應用於各種業務用途,並解決各式各樣的問題。常見的監督式學習範例包括:
推薦系統:線上平台和影視串流服務皆會使用監督式學習演算法,根據先前的客戶行為或購物記錄提供推薦內容。這些模型會擷取使用者行為的重要資訊,並推薦類似的產品和內容。
如果要瞭解監督式學習與非監督式學習之間的差異,最主要的差別就在訓練模型的輸入資料類型。監督式學習使用加上標籤的訓練資料集,試圖訓練一個模型達成特定且預先定義的目標。
相較之下,非監督式學習使用未加上標籤的資料並自行運作,在沒有明確指示的情況下嘗試學習資料結構。