Ringkasan pengelompokan
Pengelompokan adalah teknik machine learning tanpa pengawasan yang dapat Anda gunakan untuk mengelompokkan data yang serupa. Ini adalah pendekatan yang berguna saat Anda ingin memahami grup atau cluster yang Anda miliki dalam data, tetapi tidak memiliki data berlabel untuk melatih model. Misalnya, jika memiliki data tanpa label tentang pembelian tiket kereta bawah tanah, Anda dapat mengelompokkan data tersebut berdasarkan waktu pembelian tiket untuk lebih memahami jangka waktu penggunaan kereta bawah tanah yang paling berat. Untuk informasi selengkapnya, lihat Apa yang dimaksud dengan pengelompokan?
Model k-means
banyak digunakan untuk melakukan pengelompokan. Anda dapat menggunakan model k-means dengan
fungsi ML.PREDICT
untuk mengelompokkan data, atau dengan
fungsi ML.DETECT_ANOMALIES
untuk melakukan deteksi anomali.
Model k-means menggunakan
pengelompokan berbasis centroid untuk mengatur data ke dalam cluster.
Untuk mendapatkan informasi tentang centroid model k-mean, Anda dapat menggunakan fungsi ML.CENTROIDS
.
Artikel pusat informasi yang direkomendasikan
Dengan menggunakan setelan default dalam pernyataan CREATE MODEL
dan
fungsi inferensi, Anda dapat membuat dan menggunakan model pengelompokan bahkan
tanpa banyak pengetahuan ML. Namun, memiliki pengetahuan dasar tentang pengembangan ML, dan model pengelompokan secara khusus, akan membantu Anda mengoptimalkan data dan model untuk memberikan hasil yang lebih baik. Sebaiknya gunakan referensi berikut untuk mengembangkan
pengetahuan tentang teknik dan proses ML:
- Kursus Singkat Machine Learning
- Pengantar Machine Learning
- Machine Learning Tingkat Menengah
- Pengelompokan