클러스터링 개요

클러스터링은 비슷한 레코드를 그룹화하는 데 사용할 수 있는 비지도 머신러닝 기법입니다. 이는 데이터에 있는 그룹 또는 클러스터의 유형을 파악하고 싶지만 모델을 학습시킬 라벨이 지정된 데이터가 없는 경우에 유용한 접근 방식입니다. 예를 들어 지하철 티켓 구매에 관한 라벨이 지정되지 않은 데이터가 있다면 티켓 구매 시간별로 데이터를 클러스터링하여 지하철 사용이 가장 많은 기간을 더 잘 파악할 수 있습니다. 자세한 내용은 클러스터링이란 무엇인가요?를 참고하세요.

K-평균 모델은 클러스터링을 수행하는 데 널리 사용됩니다. ML.PREDICT 함수와 함께 k-평균 모델을 사용하여 데이터를 클러스터링하거나 ML.DETECT_ANOMALIES 함수와 함께 이상 감지를 실행할 수 있습니다.

K-평균 모델은 중심점 기반 클러스터링을 사용하여 데이터를 클러스터로 구성합니다. k-평균 모델의 중심에 관한 정보를 가져오려면 ML.CENTROIDS 함수를 사용하면 됩니다.