重合概览

聚类是一种非监督式机器学习技术,可用于将相似的记录归为一组。如果您想要了解数据中存在哪些组或簇,但没有标记数据来训练模型,则此方法非常有用。例如,如果您有关于地铁票购买交易的未标记数据,则可以按票券购买时间对这些数据进行分组,以便更好地了解地铁使用量最高的时间段。如需了解详情,请参阅什么是重合?

K-means 模型广泛用于执行聚类。您可以将 K-means 模型与 ML.PREDICT 函数搭配使用来对数据进行聚类,也可以与 ML.DETECT_ANOMALIES 函数搭配使用来执行异常值检测

K-means 模型使用基于质心的聚类将数据整理成多个聚类。如需获取有关 k-means 模型中心点的信息,您可以使用 ML.CENTROIDS 函数

通过使用 CREATE MODEL 语句和推理函数中的默认设置,即使您没有太多机器学习方面的知识,也可以创建和使用聚类模型。不过,具备机器学习开发(尤其是聚类模型)方面的基本知识有助于您优化数据和模型,从而获得更好的结果。我们建议您使用以下资源熟悉机器学习技术和流程: