Descripción general del agrupamiento en clústeres
El agrupamiento en clústeres es una técnica de aprendizaje automático no supervisado que puedes usar para agrupar registros similares. Es un enfoque útil cuando deseas comprender qué grupos o clústeres tienes en tus datos, pero no tienes datos etiquetados para entrenar un modelo. Por ejemplo, si tuvieras datos sin etiqueta sobre las compras de boletos de metro, podrías agruparlos por hora de compra de boletos para comprender mejor qué períodos tienen el mayor uso del metro. Para obtener más información, consulta ¿Qué es el agrupamiento?
Los modelos de K-means se usan ampliamente para realizar el agrupamiento. Puedes usar modelos de k-means con la
función ML.PREDICT
para agrupar datos o con la
función ML.DETECT_ANOMALIES
para realizar la detección de anomalías.
Los modelos de k-means usan el agrupamiento basado en centroides para organizar los datos en clústeres.
Para obtener información sobre los centroides de un modelo k-means, puedes usar la función ML.CENTROIDS
.