지도 미세 조정은 사용 가능한 라벨 지정된 데이터와 함께 잘 정의된 태스크가 있을 때 유용한 옵션입니다. 특히 언어 또는 콘텐츠가 대규모 모델이 원래 학습된 데이터와 크게 다른 도메인별 애플리케이션에 효과적입니다.
지도 조정은 라벨 지정된 데이터 세트를 사용해서 모델 동작을 조정합니다. 이 프로세스는 예측과 실제 라벨 사이의 차이를 최소화하기 위해 모델 가중치를 조정합니다. 다음 유형의 태스크에 대해 모델 성능을 향상시킬 수 있습니다.
- 분류
- 감정 분석
- 항목 추출
- 복잡하지 않은 콘텐츠 요약
- 도메인 특정 쿼리 작성
지원되는 모델
다음 Gemini 텍스트 모델은 지도 조정을 지원합니다.
gemini-1.0-pro-002
텍스트 모델에서 지도 조정을 사용하는 사용 사례
기반 텍스트 모델은 예상 출력 또는 태스크를 프롬프트에 명확하고 간결하게 정의할 수 있고 프롬프트가 예상 출력을 일관되게 생성할 때 원활하게 작동합니다. 모델이 일반적인 언어 패턴에서 벗어나 틈새 또는 특정 항목을 학습하도록 하려면 해당 모델을 조정하는 것이 좋습니다. 예를 들어 모델 조정을 사용해서 모델에 다음 항목을 학습시킬 수 있습니다.
- 출력을 생성하기 위한 특정 구조 또는 형식
- 간결한 출력 또는 상세 출력을 제공할 시기와 같은 특정 동작
- 특정 유형의 입력에 대한 맞춤설정된 특정 출력
다음 예시는 프롬프트 요청 사항만으로는 캡처하기 어려운 사용 사례입니다.
분류: 예상 응답은 특정 단어 또는 구문입니다.
모델을 조정하면 모델이 지나치게 상세한 응답을 생성하는 것을 방지할 수 있습니다.
요약: 요약은 특정 형식을 따릅니다. 예를 들어 채팅 요약에서 개인 식별 정보(PII)를 삭제해야 할 수 있습니다.
스피커 이름을
#Person1
및#Person2
로 바꾸는 이 형식은 설명하기 어렵고 기반 모델이 자연스럽게 이러한 응답을 생성하지 못할 수 있습니다.추출 질문 응답: 질문은 컨텍스트에 관한 것이고 답변은 컨텍스트의 하위 문자열입니다.
'Last Glacial Maximum' 응답은 컨텍스트의 특정 구문입니다.
채팅: 캐릭터 또는 역할을 따르도록 모델 응답을 맞춤설정해야 합니다.
다음 상황에서도 모델을 조정할 수 있습니다.
- 프롬프트가 예상 결과를 일관되게 생성하지 못합니다.
- 태스크가 너무 복잡해 프롬프트에서 정의할 수 없습니다. 예를 들어 모델이 프롬프트에서 명확히 설명하기 어려운 동작을 위해 동작 복제를 수행하도록 할 수 있습니다.
- 유도하기 쉽지만 프롬프트에서 공식화하기 어려운 태스크에 대한 인간의 직관은 복잡합니다.
- 컨텍스트 길이를 줄이려면 퓨샷 예를 제거합니다.
다음 단계
- 지도 조정 데이터 세트 준비