Gemini 모델의 지도 미세 조정 정보

지도 미세 조정은 사용 가능한 라벨 지정된 데이터와 함께 잘 정의된 태스크가 있을 때 유용한 옵션입니다. 특히 언어 또는 콘텐츠가 대규모 모델이 원래 학습된 데이터와 크게 다른 도메인별 애플리케이션에 효과적입니다. 텍스트, 이미지, 오디오, 문서 데이터 유형을 조정할 수 있습니다.

지도 미세 조정은 라벨 지정된 데이터 세트를 사용해서 모델 동작을 조정합니다. 이 프로세스는 예측과 실제 라벨 사이의 차이를 최소화하기 위해 모델 가중치를 조정합니다. 예를 들어 다음 유형의 태스크에 대해 모델 성능을 개선할 수 있습니다.

  • 분류
  • 요약
  • 추출적 질의 응답
  • 채팅

지원되는 모델

다음 Gemini 모델은 지도 조정을 지원합니다.

  • gemini-1.5-pro-002(정식 버전에서는 텍스트, 이미지, 오디오, 문서 지원)
  • gemini-1.5-flash-002(정식 버전에서는 텍스트, 이미지, 오디오, 문서 지원)
  • gemini-1.0-pro-002(미리보기에서는 텍스트 조정만 지원)

제한사항

  • 최대 입력 및 출력 토큰 수:
    • 학습 예시: 32,000
    • 서빙: 32,000
  • 검사 데이터 세트 크기: 256개 예시
  • 학습 데이터 세트 파일 크기: JSONL의 경우 최대 1GB
  • 어댑터 크기:
    • Gemini 1.5 Pro: 지원되는 값은 1 및 4입니다(기본값은 4). 더 높은 값(예: 8 또는 16)을 사용하면 실패합니다.
    • Gemini 1.5 Flash: 지원되는 값은 1, 4, 8, 16입니다(기본값은 8).

지도 미세 조정을 사용하는 사용 사례

파운데이션 모델은 예상 출력 또는 태스크를 프롬프트에 명확하고 간결하게 정의할 수 있고 프롬프트가 예상 출력을 일관되게 생성할 때 원활하게 작동합니다. 모델이 일반 패턴에서 벗어나 틈새 또는 특정 항목을 학습하도록 하려면 해당 모델을 조정하는 것이 좋습니다. 예를 들어 모델 조정을 사용해서 모델에 다음 항목을 학습시킬 수 있습니다.

  • 출력을 생성하기 위한 특정 구조 또는 형식
  • 간결한 출력 또는 상세 출력을 제공할 시기와 같은 특정 동작
  • 특정 유형의 입력에 대한 맞춤설정된 특정 출력

다음 예시는 프롬프트 요청 사항만으로는 캡처하기 어려운 사용 사례입니다.

  • 분류: 예상 응답은 특정 단어 또는 구문입니다.

    모델을 조정하면 모델이 지나치게 상세한 응답을 생성하는 것을 방지할 수 있습니다.

  • 요약: 요약은 특정 형식을 따릅니다. 예를 들어 채팅 요약에서 개인 식별 정보(PII)를 삭제해야 할 수 있습니다.

    스피커 이름을 #Person1#Person2로 바꾸는 이 형식은 설명하기 어렵고 기반 모델이 자연스럽게 이러한 응답을 생성하지 못할 수 있습니다.

  • 추출 질문 응답: 질문은 컨텍스트에 관한 것이고 답변은 컨텍스트의 하위 문자열입니다.

    'Last Glacial Maximum' 응답은 컨텍스트의 특정 구문입니다.

  • 채팅: 캐릭터 또는 역할을 따르도록 모델 응답을 맞춤설정해야 합니다.

다음 상황에서도 모델을 조정할 수 있습니다.

  • 프롬프트가 예상 결과를 일관되게 생성하지 못합니다.
  • 태스크가 너무 복잡해 프롬프트에서 정의할 수 없습니다. 예를 들어 모델이 프롬프트에서 명확히 설명하기 어려운 동작을 위해 동작 복제를 수행하도록 할 수 있습니다.
  • 유도하기 쉽지만 프롬프트에서 공식화하기 어려운 태스크에 대한 인간의 직관은 복잡합니다.
  • 컨텍스트 길이를 줄이려면 퓨샷 예를 제거합니다.

조정 작업 리전 구성

변환된 데이터 세트 및 조정된 모델과 같은 사용자 데이터는 조정 작업 리전에 저장됩니다. 조정 중에 사용 가능한 가속기를 위해 다른 US 또는 EU 리전으로 계산이 오프로드될 수 있습니다. 오프로드는 사용자에게 투명하게 수행됩니다.

  • Vertex AI SDK를 사용하는 경우 초기화 시 리전을 지정할 수 있습니다. 예를 들면 다음과 같습니다.

    import vertexai
    vertexai.init(project='myproject', location='us-central1')
    
  • tuningJobs.create 메서드를 사용하여 POST 요청을 전송하여 지도 미세 조정 작업을 만드는 경우 URL을 사용하여 조정 작업이 실행되는 리전을 지정합니다. 예를 들어 다음 URL에서 TUNING_JOB_REGION의 두 인스턴스를 모두 작업이 실행되는 리전으로 바꿔 리전을 지정합니다.

     https://TUNING_JOB_REGION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/TUNING_JOB_REGION/tuningJobs
    
  • Google Cloud 콘솔을 사용하는 경우 모델 세부정보 페이지의 리전 드롭다운 필드에서 리전 이름을 선택할 수 있습니다. 이 페이지는 기본 모델과 조정된 모델 이름을 선택하는 페이지와 동일합니다.

할당량

할당량은 동시 조정 작업 수에 적용됩니다. 모든 프로젝트에는 조정 작업을 최소 하나 이상 실행할 수 있는 기본 할당량이 제공됩니다. 이 할당량은 사용 가능한 모든 리전 및 지원되는 모델에서 공유되는 전역 할당량입니다. 더 많은 작업을 동시에 실행하려면 Global concurrent tuning jobs추가 할당량을 요청해야 합니다.

가격 책정

Gemini 1.5 Flash 및 Gemini 1.5 Pro 조정 가격은 Vertex AI 가격 책정에서 확인할 수 있습니다.

모든 모델의 경우 조정 후에도 조정된 모델의 추론 비용이 계속 적용됩니다. 추론 가격은 Gemini의 각 안정화 버전에서 동일합니다.

gemini-1.0-pro-002에 대한 지도 미세 조정은 미리보기 상태입니다. 조정이 미리보기 버전인 경우 모델을 조정하는 데 비용이 청구되지 않습니다.

자세한 내용은 Vertex AI 가격 책정사용 가능한 Gemini 안정화 모델 버전을 참조하세요.

다음 단계