지도 학습과 비지도 학습은 인공지능 및 머신러닝에서 주로 사용되는 두 가지 접근방법입니다. 지도 학습과 비지도 학습을 구분하는 가장 간단한 방법은 모델의 학습 방법과 알고리즘에 사용되는 학습 데이터의 유형을 보는 것입니다.
그러나 지도 학습과 비지도 학습 간에 또 다른 차이점이 있습니다. 이러한 차이로 인해 특정 기법이 조직의 구체적인 목표와 비즈니스 목표를 달성하는 데 더 적합합니다.
여기서는 니즈에 가장 적합한 접근 방식을 이해할 수 있도록 지도 머신러닝과 비지도 머신러닝의 주요 차이점을 살펴보겠습니다.
신규 고객에게는 최대 $300의 무료 크레딧이 제공되어 Vertex AI 및 기타 Google Cloud 제품을 사용해 볼 수 있습니다.
지도 머신러닝과 비지도 머신러닝 간의 가장 큰 차이점은 사용되는 데이터 유형입니다. 지도 학습은 라벨이 지정된 학습 데이터를 사용하고 비지도 학습은 그렇지 않습니다.
간단히 말해서 지도 학습 모델은 무엇이 올바른 출력 값인지를 기본적으로 이해하고 있습니다.
지도 학습의 경우 알고리즘은 샘플 데이터 세트를 사용해서 예측을 수행하도록 자체를 학습시키고 반복적인 조정을 통해 오류를 최소화합니다. 이러한 데이터 세트는 컨텍스트에 따라 라벨이 지정되어, 모델이 "올바른" 답변을 제공할 수 있도록 원하는 출력 값을 제공합니다.
반면 비지도 학습 알고리즘은 구체적인 지침이나 안내 없이 독립적으로 데이터에 내재된 구조를 학습합니다. 라벨이 지정되지 않은 입력 데이터를 제공하기만 하면 알고리즘이 데이터 세트에서 자연스러운 패턴을 식별하도록 합니다.
데이터 유형은 이 두 접근 방식을 구분하는 가장 쉬운 방법이지만, 각 방식은 서로 다른 목표와 애플리케이션을 가지고 있다는 점에서도 차별화됩니다.
지도 학습 모델은 입력 및 출력 데이터 간의 관계를 학습하는 데 더 많은 중점을 둡니다. 예를 들어 지도 모델을 사용하면 날씨 상태, 공항 통행량, 피크 시간대의 비행 시간 등의 특정 매개변수를 기반으로 비행 시간을 예측할 수 있습니다.
반면에 비지도 학습은 라벨이 지정되지 않은 원시 데이터에서 새로운 패턴과 관계를 발견하는 데 더 유용합니다. 예를 들어 비지도 학습 모델을 사용하면 관련 제품을 함께 구입하는 구매자 그룹을 식별하여 비슷한 고객들에게 추천할 다른 물품을 제안할 수 있습니다.
따라서 지도 머신러닝과 비지도 머신러닝은 서로 다른 유형의 문제를 해결하기 위해 배포됩니다. 지도 머신러닝은 날씨 예측, 가격 책정 변동, 감정 분석, 스팸 감지와 같은 분류 및 회귀 태스크에 적합합니다. 비지도 학습은 이상점 감지, 빅데이터 시각화, 고객 세분화와 같은 탐색적인 데이터 분석 및 클러스터링 태스크에 보다 일반적으로 사용됩니다.
이제 지도 학습과 비지도 학습의 차이점을 이해했으니 어떤 접근 방식이 적합할까요?
전반적인 목표와 요구사항, 해결하려는 사용 사례, 데이터 분석, 처리, 관리에 관한 일반적인 팀 접근 방식에 따라 올바른 접근 방식을 선택해야 합니다.
일반적으로 조직에 가장 적합한 옵션을 결정할 때 다음 사항을 고려해야 합니다.
지도 학습과 비지도 학습 중에서 선택할 때는 해결하려는 구체적인 문제, 사용 가능한 데이터, 모델을 구축하고 관리할 수 있는 도구와 경험을 갖추었는지에 따라 달라집니다.
이러한 옵션이 적합한지 알 수 없을 때는 어떻게 해야 할까요? 세 번째 접근 방법인 준지도 학습을 고려할 수도 있습니다.
준지도 학습은 지도 학습과 비지도 학습의 특성을 조합한 것입니다. 이 카테고리에 속하는 머신러닝 기법은 라벨 지정 데이터와 라벨 미지정 데이터를 모두 사용해서 예측 모델 학습을 수행합니다.
준지도 학습은 소량의 라벨 지정 데이터를 사용해서 초기 모델을 학습하며, 이를 사용해서 대량의 라벨 미지정 데이터를 기반으로 라벨을 예측할 수 있습니다. 그런 다음 원래 라벨이 지정된 데이터와 예측된 라벨(유사 라벨)이 있는 데이터 모두에 모델을 반복적으로 적용합니다. 이후에는 라벨 지정 데이터 세트에 가장 정확한 예측을 추가하고 프로세스를 다시 반복하여 모델 성능을 계속 향상시킵니다.