Panoramica del clustering

Il clustering è una tecnica di machine learning non supervisionato che puoi utilizzare per raggruppare record simili. Si tratta di un approccio utile quando vuoi comprendere quali gruppi o cluster sono presenti nei tuoi dati, ma non hai dati etichettati su cui addestrare un modello. Ad esempio, se avevi dati non etichettati su acquisti di biglietti per la metropolitana, puoi raggrupparli in base al tempo di acquisto dei biglietti per a capire meglio quali periodi di tempo hanno il maggiore utilizzo della metropolitana. Per ulteriori informazioni, vedi Che cos'è il clustering?

I modelli K-means sono ampiamente utilizzati per eseguire il clustering. Puoi utilizzare i modelli K-means con Funzione ML.PREDICT per raggruppare i dati o con Funzione ML.DETECT_ANOMALIES per eseguire il rilevamento di anomalie.

I modelli K-means utilizzano clustering basato su centroid per organizzare i dati in cluster. Per ottenere informazioni sui centroidi di un modello k-mean, puoi utilizzare Funzione ML.CENTROIDS.