Gemini 모델의 지도 미세 조정 정보

지도 미세 조정은 사용 가능한 라벨 지정된 데이터와 함께 잘 정의된 태스크가 있을 때 유용한 옵션입니다. 특히 언어 또는 콘텐츠가 대규모 모델이 원래 학습된 데이터와 크게 다른 도메인별 애플리케이션에 효과적입니다. 텍스트, 이미지, 오디오, 문서 데이터 유형을 조정할 수 있습니다.

지도 미세 조정은 라벨 지정된 데이터 세트를 사용해서 모델 동작을 조정합니다. 이 프로세스는 예측과 실제 라벨 사이의 차이를 최소화하기 위해 모델 가중치를 조정합니다. 예를 들어 다음 유형의 태스크에 대해 모델 성능을 개선할 수 있습니다.

분류
요약
추출적 질의 응답
채팅

주요 조정 사용 사례에 관한 논의는 수백 개의 조직이 Gemini 모델을 미세 조정하고 있습니다. 다음은 개발자가 가장 선호하는 사용 사례입니다. 블로그 게시물을 참조하세요.

자세한 내용은 Gemini에 지도 미세 조정을 사용하는 경우를 참조하세요.

지원되는 모델

다음 Gemini 모델은 지도 미세 조정을 지원합니다.

사고를 지원하는 모델의 경우 사고 예산을 사용 중지나 최저값으로 설정하는 것이 좋습니다. 이렇게 하면 조정된 태스크의 성능을 향상시키고 비용을 절감할 수 있습니다. 지도 미세 조정 중에 모델은 학습 데이터에서 학습되고 사고 과정을 생략합니다. 따라서 결과로 조정된 모델은 사고 예산 없이 조정된 태스크를 효과적으로 수행할 수 있습니다.

제한사항

Gemini 2.5 Flash
Gemini 2.5 Flash-Lite

사양	값
최대 입력 및 출력 학습 토큰	131,072
최대 입력 및 출력 제공 토큰	기본 Gemini 모델과 동일
최대 검증 데이터 세트 크기	예: 5000
최대 학습 데이터 세트 파일 크기	JSONL의 경우 1GB
최대 학습 데이터 세트 크기	텍스트 전용 예시 100만 개 또는 멀티모달 예시 30만 개
어댑터 크기	지원되는 값은 1, 2, 4, 8, 16입니다.

Gemini 2.5 Pro

사양	값
최대 입력 및 출력 학습 토큰	131,072
최대 입력 및 출력 제공 토큰	기본 Gemini 모델과 동일
최대 검증 데이터 세트 크기	예: 5000
최대 학습 데이터 세트 파일 크기	JSONL의 경우 1GB
최대 학습 데이터 세트 크기	텍스트 전용 예시 100만 개 또는 멀티모달 예시 30만 개
어댑터 크기	지원되는 값은 1, 2, 4, 8입니다.

Gemini 2.0 Flash
Gemini 2.0 Flash-Lite

사양	값
최대 입력 및 출력 학습 토큰	131,072
최대 입력 및 출력 제공 토큰	기본 Gemini 모델과 동일
최대 검증 데이터 세트 크기	예: 5000
최대 학습 데이터 세트 파일 크기	JSONL의 경우 1GB
최대 학습 데이터 세트 크기	텍스트 전용 예시 100만 개 또는 멀티모달 예시 30만 개
어댑터 크기	지원되는 값은 1, 2, 4, 8입니다.

알려진 문제

조정된 Gemini 모델에 추론 요청을 제출할 때 제어된 생성을 적용하면 조정 및 추론 시간 동안 데이터가 일치하지 않아 모델 품질이 저하될 수 있습니다. 조정 중에는 제어 생성이 적용되지 않으므로 조정된 모델은 추론 시 제어 생성을 제대로 처리할 수 없습니다. 감독 기반 미세 조정은 정형 출력을 생성하도록 모델을 효과적으로 맞춤설정합니다. 따라서 조정된 모델에 대한 추론 요청을 할 때는 제어된 생성을 적용할 필요가 없습니다.

지도 미세 조정을 사용하는 사용 사례

파운데이션 모델은 예상 출력 또는 태스크를 프롬프트에 명확하고 간결하게 정의할 수 있고 프롬프트가 예상 출력을 일관되게 생성할 때 원활하게 작동합니다. 모델이 일반 패턴에서 벗어나 틈새 또는 특정 항목을 학습하도록 하려면 해당 모델을 조정하는 것이 좋습니다. 예를 들어 모델 조정을 사용해서 모델에 다음 항목을 학습시킬 수 있습니다.

출력을 생성하기 위한 특정 구조 또는 형식
간결한 출력 또는 상세 출력을 제공할 시기와 같은 특정 동작
특정 유형의 입력에 대한 맞춤설정된 특정 출력

다음 예시는 프롬프트 요청 사항만으로는 캡처하기 어려운 사용 사례입니다.

분류: 예상 응답은 특정 단어 또는 구문입니다.

프롬프트: 다음 텍스트를 다음 클래스 중 하나로 분류하세요. [비즈니스, 엔터테인먼트] 텍스트: 투자 포트폴리오 다양화

응답: 비즈니스

모델을 조정하면 모델이 지나치게 상세한 응답을 생성하는 것을 방지할 수 있습니다.

요약: 요약은 특정 형식을 따릅니다. 예를 들어 채팅 요약에서 개인 식별 정보(PII)를 삭제해야 할 수 있습니다.

프롬프트: 요약: Jessica: 좋습니다. 타임스 스퀘어에서 뵙겠습니다. Alexander: 10시에 뵙겠습니다.

응답: #Person1과 #Person2가 오전 10시 타임스 스퀘어에서 만나는 데 동의합니다.

스피커 이름을 #Person1 및 #Person2로 바꾸는 이 형식은 설명하기 어렵고 파운데이션 모델에서 자연스럽게 이러한 대답을 생성하지 못할 수 있습니다.

추출 질문 응답: 질문은 컨텍스트에 관한 것이고 답변은 컨텍스트의 하위 문자열입니다.

프롬프트: 컨텍스트: 지난 21,000년 동안 마지막 최대 빙하기(LGM)와 그 이후의 빙하 쇠퇴기를 거치며 아마존 열대 우림 식생에 상당한 변화가 있었다는 증거가 있습니다. 질문: LGM은 무엇을 의미하나요?

응답: 마지막 최대 빙하기

'Last Glacial Maximum' 응답은 컨텍스트의 특정 구문입니다.

채팅: 페르소나, 역할 또는 캐릭터를 따르도록 모델 대답을 맞춤설정해야 합니다.

프롬프트: 사용자: 오늘 날씨가 어떤가요?

응답: 어시스턴트: 예시 조직의 가상 상점 주인으로서 저는 구매와 배송만 도와드릴 수 있습니다.

다음 상황에서도 모델을 조정할 수 있습니다.

프롬프트가 예상 결과를 일관되게 생성하지 못합니다.
태스크가 너무 복잡해 프롬프트에서 정의할 수 없습니다. 예를 들어 모델이 프롬프트에서 명확히 설명하기 어려운 동작을 위해 동작 복제를 수행하도록 할 수 있습니다.
태스크에 대한 복잡한 직관이 있지만 프롬프트에서 공식화하기는 어렵습니다.
컨텍스트 길이를 줄이려면 퓨샷 예를 제거합니다.

조정 작업 리전 구성

변환된 데이터 세트 및 조정된 모델과 같은 사용자 데이터는 조정 작업 리전에 저장됩니다. 조정 중에 사용 가능한 가속기를 위해 다른 US 또는 EU 리전으로 계산이 오프로드될 수 있습니다. 오프로드는 사용자에게 투명하게 수행됩니다.

Vertex AI SDK를 사용하는 경우 초기화 시 리전을 지정할 수 있습니다. 예를 들면 다음과 같습니다.
```
import vertexai
vertexai.init(project='myproject', location='us-central1')
```
tuningJobs.create 메서드를 사용하여 POST 요청을 전송하여 지도 미세 조정 작업을 만드는 경우 URL을 사용하여 조정 작업이 실행되는 리전을 지정합니다. 예를 들어 다음 URL에서 TUNING_JOB_REGION의 두 인스턴스를 모두 작업이 실행되는 리전으로 바꿔 리전을 지정합니다.
```
 https://TUNING_JOB_REGION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/TUNING_JOB_REGION/tuningJobs
```
Google Cloud 콘솔을 사용하는 경우 모델 세부정보 페이지의 리전 드롭다운 필드에서 리전 이름을 선택할 수 있습니다. 이 페이지는 기본 모델과 조정된 모델 이름을 선택하는 페이지와 동일합니다.

조정된 모델 평가

다음과 같은 방법으로 조정된 모델을 평가할 수 있습니다.

조정 및 검증 측정항목: 조정 작업이 완료된 후 조정 및 검증 측정항목을 사용하여 조정된 모델을 평가합니다.
Gen AI Evaluation Service를 사용한 통합 평가(프리뷰): Gen AI Evaluation Service를 사용하여 조정 중에 평가를 자동으로 실행하도록 조정 작업을 구성합니다. Gen AI Evaluation Service와 조정 통합에는 다음 인터페이스, 모델, 리전이 지원됩니다.
- 지원되는 인터페이스: Google Gen AI SDK 및 REST API
- 지원되는 모델: gemini-2.5-pro, gemini-2.5-flash, gemini-2.5-flash-lite
- 지원되는 리전: 지원되는 리전 목록은 지원되는 리전을 참조하세요.

Quota

할당량은 동시 조정 작업 수에 적용됩니다. 모든 프로젝트에는 조정 작업을 최소 하나 이상 실행할 수 있는 기본 할당량이 제공됩니다. 이 할당량은 사용 가능한 모든 리전 및 지원되는 모델에서 공유되는 전역 할당량입니다. 더 많은 작업을 동시에 실행하려면 Global concurrent tuning jobs의 추가 할당량을 요청해야 합니다.

조정 중에 자동으로 평가를 실행하도록 Gen AI Evaluation Service를 구성하는 경우 Gen AI Evaluation Service 할당량을 참조하세요.

가격 책정

Vertex AI 가격 책정에서 Gemini 지도 미세 조정 가격을 확인할 수 있습니다.

학습 토큰 수는 학습 데이터 세트의 토큰 수와 에포크 수를 곱하여 계산됩니다. 조정 후에도 조정된 모델의 추론(예측 요청) 비용이 계속 적용됩니다. 추론 가격은 Gemini의 각 안정화 버전에서 동일합니다. 자세한 내용은 사용 가능한 Gemini 안정화 모델 버전을 참조하세요.

조정 중에 Gen AI Evaluation Service가 자동으로 실행되도록 구성하면 평가 비용이 일괄 예측 작업으로 청구됩니다. 자세한 내용은 가격 책정을 참조하세요.

다음 단계

지도 미세 조정 데이터 세트 준비
조정된 Gemini 모델 배포에 대해 알아보기