클러스터링 개요
클러스터링은 비슷한 레코드를 함께 그룹화하는 데 사용할 수 있는 비지도 머신러닝 기법입니다. 데이터에 어떤 그룹이나 클러스터가 있는지 파악하고 싶지만 모델을 학습할 라벨 지정 데이터가 없을 때 유용한 접근 방식입니다. 예를 들어 지하철 티켓 구매에 관한 라벨이 지정되지 않은 데이터가 있는 경우 티켓 구매 시간별로 데이터를 클러스터링하여 지하철 사용이 가장 많은 기간을 더 잘 파악할 수 있습니다. 자세한 내용은 클러스터링이란 무엇인가요?를 참고하세요.
K-평균 모델은 클러스터링을 수행하는 데 널리 사용됩니다. ML.PREDICT
함수와 함께 k-평균 모델을 사용하여 데이터를 클러스터링하거나 ML.DETECT_ANOMALIES
함수와 함께 사용하여 이상 감지를 실행할 수 있습니다.
K-평균 모델은 중심 기반 클러스터링을 사용하여 데이터를 클러스터로 구성합니다.
k-평균 모델의 중심에 관한 정보를 가져오려면 ML.CENTROIDS
함수를 사용하면 됩니다.
추천 지식
CREATE MODEL
문의 기본 설정과 추론 함수를 사용하면 ML 지식이 많지 않더라도 클러스터링 모델을 만들고 사용할 수 있습니다. 하지만 ML 개발, 특히 클러스터링 모델에 관한 기본 지식을 갖추면 데이터와 모델을 모두 최적화하여 더 나은 결과를 얻을 수 있습니다. 다음 리소스를 사용하여 ML 기법과 프로세스에 익숙해지는 것이 좋습니다.