지도 학습은 라벨이 지정된 데이터 세트를 사용하여 결과를 예측하고 패턴을 인식하도록 알고리즘을 학습시키는 머신러닝의 한 카테고리입니다. 지도 학습 알고리즘은 비지도 학습과 달리 입력과 출력 간의 관계를 학습할 수 있도록 라벨이 지정된 학습이 제공됩니다.
조직은 지도 머신러닝 알고리즘을 사용하여 정확한 예측을 할 수 있는 복잡한 모델을 더 쉽게 만들 수 있습니다. 따라서 의료, 마케팅, 금융 서비스 등 다양한 산업과 분야에서 널리 사용됩니다.
여기서는 AI의 지도 학습에 대한 기초, 지도 학습 알고리즘의 작동 방식, 가장 일반적인 사용 사례를 살펴봅니다.
신규 고객에게는 최대 $300의 무료 크레딧이 제공되어 Vertex AI 및 기타 Google Cloud 제품을 사용해 볼 수 있습니다.
지도 학습에 사용되는 데이터에는 라벨이 지정됩니다. 즉, 입력(특성)과 올바른 출력(라벨)의 예가 모두 포함됩니다. 알고리즘은 새 데이터에 대한 예측이 요청되었을 때 이러한 학습 쌍의 대규모 데이터 세트를 분석하여 바람직한 출력 값이 무엇인지 추론합니다.
예를 들어 나무 사진을 식별하도록 모델을 학습시키려는 경우 다양한 나무 종류의 예와 각 종의 이름이 포함된 라벨이 지정된 데이터 세트를 제공합니다. 그리고 라벨이 지정된 출력을 기반으로 각 트리에 속하는 특성 세트를 알고리즘이 정의하도록 하면 됩니다. 그런 다음 나무 사진을 보여주고 어떤 종인지 추측해 달라고 요청하여 모델을 테스트할 수 있습니다. 모델이 오답을 제공하는 경우 계속해서 모델을 학습시키고 더 많은 예를 사용하여 매개변수를 조정함으로써 정확성을 개선하고 오류를 최소화할 수 있습니다.
모델을 학습시키고 테스트한 후에는 모델이 학습한 이전 지식을 바탕으로 알려지지 않은 데이터에 대한 예측을 수행할 수 있습니다.
지도 학습에 사용되는 데이터에는 라벨이 지정됩니다. 즉, 입력(특성)과 올바른 출력(라벨)의 예가 모두 포함됩니다. 알고리즘은 새 데이터에 대한 예측이 요청되었을 때 이러한 학습 쌍의 대규모 데이터 세트를 분석하여 바람직한 출력 값이 무엇인지 추론합니다.
예를 들어 나무 사진을 식별하도록 모델을 학습시키려는 경우 다양한 나무 종류의 예와 각 종의 이름이 포함된 라벨이 지정된 데이터 세트를 제공합니다. 그리고 라벨이 지정된 출력을 기반으로 각 트리에 속하는 특성 세트를 알고리즘이 정의하도록 하면 됩니다. 그런 다음 나무 사진을 보여주고 어떤 종인지 추측해 달라고 요청하여 모델을 테스트할 수 있습니다. 모델이 오답을 제공하는 경우 계속해서 모델을 학습시키고 더 많은 예를 사용하여 매개변수를 조정함으로써 정확성을 개선하고 오류를 최소화할 수 있습니다.
모델을 학습시키고 테스트한 후에는 모델이 학습한 이전 지식을 바탕으로 알려지지 않은 데이터에 대한 예측을 수행할 수 있습니다.
머신러닝의 지도 학습은 일반적으로 분류와 회귀라는 두 가지 카테고리로 나뉩니다.
분류 알고리즘은 입력 데이터를 기반으로 범주형 라벨 또는 출력 변수를 예측하여 데이터를 그룹화하는 데 사용됩니다. 분류는 출력 변수가 범주형일 때, 즉 클래스가 두 개 이상 있을 때 사용됩니다.
분류 알고리즘의 가장 일반적인 사용 사례 중 하나는 이메일 받은편지함의 스팸 필터입니다. 이 경우 지도 학습 모델은 스팸과 정상 이메일 모두에 대한 라벨이 있는 예가 포함된 데이터 세트를 사용하여 이메일의 스팸 여부를 예측하도록 학습됩니다. 이 알고리즘은 발신자, 제목, 본문 등 각 이메일의 정보를 추출합니다. 그런 다음 이러한 요소와 해당 출력 라벨을 사용하여 패턴을 학습하고 이메일이 정상인지 스팸인지를 나타내는 점수를 할당합니다.
회귀 알고리즘은 실수값 또는 연속값을 예측하는 데 사용되며, 알고리즘은 두 개 이상의 변수 간의 관계를 감지합니다.
회귀 태스크의 일반적인 예로는 업무 경험을 바탕으로 급여를 예측하는 태스크가 있습니다. 예를 들어 업무 경험(예: 근무 기간, 업종 또는 분야, 위치 등)과 그에 상응하여 책정된 급여 금액과 관련된 값이 지도 학습 알고리즘에 입력될 수 있습니다. 모델이 학습되면 업무 경험을 기반으로 평균 급여를 예측하는 데 사용할 수 있습니다.
지도 학습 모델은 다양한 문제를 다루는 다양한 비즈니스 사용 사례에 사용할 수 있습니다. 일반적인 지도 학습의 예는 다음과 같습니다.
추천 시스템: 온라인 플랫폼 및 스트리밍 서비스는 지도 학습 알고리즘을 사용하여 이전 고객 행동이나 쇼핑 내역을 기반으로 추천을 제공합니다. 모델은 사용자 행동에 대한 중요한 정보를 추출하고 유사한 제품과 콘텐츠를 제안합니다.
지도 학습과 비지도 학습의 차이를 이해할 때 주된 차이점은 모델 학습에 사용되는 입력 데이터 유형입니다. 지도 학습은 라벨이 지정된 학습 데이터 세트를 사용하여 사전 정의된 특정 목표를 모델에 학습시킵니다.
반면 비지도 학습은 라벨이 지정되지 않은 데이터를 사용하고 자율적으로 작동하여 명시적인 지시를 받지 않고 데이터 구조를 학습합니다.