重合概览

聚类是一种非监督式机器学习技术,可用于将相似的记录归为一组。如果您想要了解数据中存在哪些组或簇,但没有标记数据来训练模型,则此方法非常有用。例如,如果您有关于地铁票购买交易的未标记数据,则可以按票券购买时间对这些数据进行分组,以便更好地了解地铁使用量最高的时间段。如需了解详情,请参阅什么是重合?

K-means 模型广泛用于执行聚类。您可以将 K-means 模型与 ML.PREDICT 函数搭配使用来对数据进行聚类,也可以与 ML.DETECT_ANOMALIES 函数搭配使用来执行异常值检测

K-means 模型使用基于质心的聚类将数据整理成多个聚类。如需获取有关 k-means 模型中心点的信息,您可以使用 ML.CENTROIDS 函数