分群總覽

分群法是一種非監督式機器學習技術,可用來將相似的記錄歸類。當您想瞭解資料中的群組或叢集,但沒有標記資料可用於訓練模型時,這項方法就很實用。舉例來說,如果您有未標示的捷運票券購買資料,可以依票券購買時間將資料分組,進一步瞭解哪些時段的捷運使用量最高。詳情請參閱「什麼是叢集?」。

k-means 模型廣泛用於執行分群作業。您可以使用 k-means 模型搭配 ML.PREDICT 函式分群資料,或搭配 ML.DETECT_ANOMALIES 函式執行異常偵測

k-means 模型會使用以群集中心為基礎的分群,將資料分組成各個叢集。如要取得 k-means 模型群集中心的相關資訊,您可以使用 ML.CENTROIDS 函式

只要使用 CREATE MODEL 陳述式和推論函式中的預設設定,即使您沒有太多機器學習知識,也能建立及使用叢集模型。不過,如果您具備機器學習開發和聚類模型的基本知識,就能同時最佳化資料和模型,進而獲得更優異的結果。建議您參考下列資源,熟悉機器學習技術和程序: