Se usó la API de Cloud Translation para traducir esta página.

Descripción general del agrupamiento en clústeres

El agrupamiento en clústeres es una técnica de aprendizaje automático no supervisado que puedes usar para agrupar registros similares. Es un enfoque útil cuando deseas comprender qué grupos o clústeres tienes en tus datos, pero no tienes datos etiquetados para entrenar un modelo. Por ejemplo, si tuvieras datos sin etiqueta sobre las compras de boletos de metro, podrías agruparlos por hora de compra de boletos para comprender mejor qué períodos tienen el mayor uso del metro. Para obtener más información, consulta ¿Qué es el agrupamiento?

Los modelos de K-means se usan ampliamente para realizar el agrupamiento. Puedes usar modelos de k-means con la función ML.PREDICT para agrupar datos o con la función ML.DETECT_ANOMALIES para realizar la detección de anomalías.

Los modelos de k-means usan el agrupamiento basado en centroides para organizar los datos en clústeres. Para obtener información sobre los centroides de un modelo k-means, puedes usar la función ML.CENTROIDS.

Conocimientos recomendados

Si usas la configuración predeterminada en las sentencias CREATE MODEL y las funciones de inferencia, puedes crear y usar un modelo de agrupamiento incluso sin mucho conocimiento de AA. Sin embargo, tener conocimientos básicos sobre el desarrollo de AA y los modelos de agrupamiento en particular, te ayuda a optimizar tus datos y tu modelo para obtener mejores resultados. Te recomendamos que uses los siguientes recursos para familiarizarte con las técnicas y los procesos de la IA: