이 페이지는 Cloud Translation API를 통해 번역되었습니다.

지도 미세 조정을 사용하여 Gemini 모델 조정

이 문서에서는 지도 미세 조정을 사용하여 Gemini 모델을 조정하는 방법을 설명합니다.

시작하기 전에

시작하기 전에 지도 미세 조정 데이터 세트를 준비해야 합니다. 사용 사례에 따라 요구사항이 다릅니다.

조정을 위한 텍스트 데이터 세트 준비: 텍스트 조정
조정을 위한 이미지 데이터 세트 준비: 이미지 조정
조정을 위한 문서 데이터 세트 준비: 문서 조정
조정을 위한 오디오 데이터 세트 준비: 오디오 조정
조정을 위한 동영상 데이터 세트 준비: 동영상 조정

지원되는 모델

다음 Gemini 모델은 지도 조정을 지원합니다.

조정 작업 만들기

Google Cloud 콘솔, Google Gen AI SDK, Vertex AI SDK for Python, REST API 또는 Colab Enterprise를 사용하여 지도 미세 조정 작업을 만들 수 있습니다.

콘솔

Google Cloud 콘솔을 사용하여 지도 미세 조정으로 텍스트 모델을 조정하려면 다음 단계를 수행합니다.

콘솔의 Vertex AI 섹션에서 Google Cloud Vertex AI 스튜디오 페이지로 이동합니다.

Vertex AI Studio로 이동
조정된 모델 만들기를 클릭합니다.
모델 세부정보에서 다음을 구성합니다.
1. 조정된 모델 이름 필드에 새 조정된 모델의 이름을 입력합니다(최대 128자(영문 기준)).
2. 기본 모델 필드에서 gemini-2.5-flash를 선택합니다.
3. 리전 드롭다운 필드에서 파이프라인 조정 작업이 실행되는 리전과 조정된 모델이 배포되는 리전을 선택합니다.
튜닝 설정에서 다음을 구성합니다.
1. 세대 수 필드에 모델 조정을 위해 실행할 단계 수를 입력합니다.
2. 어댑터 크기 필드에 모델 조정에 사용할 어댑터 크기를 입력합니다.
3. 학습률 배수 필드에 각 반복의 보폭을 입력합니다. 기본값은 1입니다. .
(선택사항) 중간 체크포인트를 사용 중지하고 최신 체크포인트만 사용하려면 마지막 체크포인트만 내보내기 전환 버튼을 클릭합니다.
계속을 클릭합니다.

조정 데이터 세트 페이지가 열립니다.
데이터 세트 파일을 업로드하려면 다음 중 하나를 선택합니다.
1. 아직 데이터 세트를 업로드하지 않았다면 Cloud Storage에 파일 업로드 라디오 버튼을 선택합니다.
2. JSONL 파일 선택 필드에서 찾아보기를 클릭하고 데이터 세트 파일을 선택합니다.
3. 데이터 세트 위치에서 찾아보기를 클릭하고 데이터 세트 파일을 저장할 Cloud Storage 버킷을 선택합니다.
4. 데이터 세트 파일이 이미 Cloud Storage 버킷에 있으면 Cloud Storage의 기존 파일 라디오 버튼을 선택합니다.
5. Cloud Storage 파일 경로 필드에서 찾아보기를 클릭한 후 데이터 세트 파일이 있는 Cloud Storage 버킷을 선택합니다.
(선택사항) 학습 중에 검증 측정항목을 가져오려면 모델 검증 사용 설정 토글을 클릭합니다.
1. 검사 데이터 세트 파일에서 검사 데이터 세트의 Cloud Storage 경로를 입력합니다.
조정 시작을 클릭합니다.

새 모델이 조정 및 증류 페이지의 Gemini Pro 조정 모델 섹션에 표시됩니다. 모델의 조정이 완료되면 상태가 성공이라고 표시됩니다.

Google Gen AI SDK

import time

from google import genai
from google.genai.types import HttpOptions, CreateTuningJobConfig, TuningDataset, EvaluationConfig, OutputConfig, GcsDestination, Metric

# TODO(developer): Update and un-comment below line
# output_gcs_uri = "gs://your-bucket/your-prefix"

client = genai.Client(http_options=HttpOptions(api_version="v1beta1"))

training_dataset = TuningDataset(
    gcs_uri="gs://cloud-samples-data/ai-platform/generative_ai/gemini/text/sft_train_data.jsonl",
)
validation_dataset = TuningDataset(
    gcs_uri="gs://cloud-samples-data/ai-platform/generative_ai/gemini/text/sft_validation_data.jsonl",
)

evaluation_config = EvaluationConfig(
    metrics=[
        Metric(
            name="FLUENCY",
            prompt_template="""Evaluate this {prediction}"""
        )
    ],
    output_config=OutputConfig(
        gcs_destination=GcsDestination(
            output_uri_prefix=output_gcs_uri,
        )
    ),
)

tuning_job = client.tunings.tune(
    base_model="gemini-2.5-flash",
    training_dataset=training_dataset,
    config=CreateTuningJobConfig(
        tuned_model_display_name="Example tuning job",
        validation_dataset=validation_dataset,
        evaluation_config=evaluation_config,
    ),
)

running_states = set([
    "JOB_STATE_PENDING",
    "JOB_STATE_RUNNING",
])

while tuning_job.state in running_states:
    print(tuning_job.state)
    tuning_job = client.tunings.get(name=tuning_job.name)
    time.sleep(60)

print(tuning_job.tuned_model.model)
print(tuning_job.tuned_model.endpoint)
print(tuning_job.experiment)
# Example response:
# projects/123456789012/locations/us-central1/models/1234567890@1
# projects/123456789012/locations/us-central1/endpoints/123456789012345
# projects/123456789012/locations/us-central1/metadataStores/default/contexts/tuning-experiment-2025010112345678

if tuning_job.tuned_model.checkpoints:
    for i, checkpoint in enumerate(tuning_job.tuned_model.checkpoints):
        print(f"Checkpoint {i + 1}: ", checkpoint)
    # Example response:
    # Checkpoint 1:  checkpoint_id='1' epoch=1 step=10 endpoint='projects/123456789012/locations/us-central1/endpoints/123456789000000'
    # Checkpoint 2:  checkpoint_id='2' epoch=2 step=20 endpoint='projects/123456789012/locations/us-central1/endpoints/123456789012345'

Vertex AI SDK for Python


import time

import vertexai
from vertexai.tuning import sft

# TODO(developer): Update and un-comment below line
# PROJECT_ID = "your-project-id"
vertexai.init(project=PROJECT_ID, location="us-central1")

sft_tuning_job = sft.train(
    source_model="gemini-2.0-flash-001",
    # 1.5 and 2.0 models use the same JSONL format
    train_dataset="gs://cloud-samples-data/ai-platform/generative_ai/gemini-1_5/text/sft_train_data.jsonl",
)

# Polling for job completion
while not sft_tuning_job.has_ended:
    time.sleep(60)
    sft_tuning_job.refresh()

print(sft_tuning_job.tuned_model_name)
print(sft_tuning_job.tuned_model_endpoint_name)
print(sft_tuning_job.experiment)
# Example response:
# projects/123456789012/locations/us-central1/models/1234567890@1
# projects/123456789012/locations/us-central1/endpoints/123456789012345
# <google.cloud.aiplatform.metadata.experiment_resources.Experiment object at 0x7b5b4ae07af0>

REST

모델 조정 작업을 만들려면 tuningJobs.create 메서드를 사용하여 POST 요청을 전송합니다. 일부 파라미터는 모든 모델에서 지원되지 않습니다. 조정하려는 모델에 적용 가능한 파라미터만 포함해야 합니다.

(선택사항) (프리뷰) 조정 작업이 완료된 후 Gen AI Evaluation Service를 사용하여 자동으로 평가를 실행하도록 evaluationConfig를 포함합니다. 이 평가 구성은 us-central1 리전에서 사용할 수 있습니다.

요청 데이터를 사용하기 전에 다음을 바꿉니다.

PROJECT_ID: 프로젝트 ID입니다.
TUNING_JOB_REGION: 조정 작업이 실행되는 리전. 또한 조정된 모델이 업로드되는 기본 리전입니다.
BASE_MODEL: 조정할 파운데이션 모델의 이름
TRAINING_DATASET_URI: 학습 데이터 세트의 Cloud Storage URI. 데이터 세트는 JSONL 파일 형식이어야 합니다. 최상의 결과를 얻으려면 100~500개 이상의 예를 제공하세요. 자세한 내용은 지도 조정 데이터 세트 정보를 참조하세요.
VALIDATION_DATASET_URI: (선택사항) 검증 데이터 세트 파일의 Cloud Storage URI
EPOCH_COUNT: (선택사항) 학습 중에 모델이 전체 학습 데이터 세트에서 수행하는 완료 횟수. 자동 입력된 추천 값을 사용하려면 설정하지 않은 상태로 둡니다.
ADAPTER_SIZE: (선택사항) 조정 작업에 사용할 어댑터 크기. 어댑터 크기는 조정 작업의 학습 가능한 파라미터 수에 영향을 미칩니다. 어댑터 크기가 크면 모델이 더 복잡한 작업을 학습할 수 있음을 의미하지만, 더 큰 학습 데이터 세트와 더 긴 학습 시간이 필요합니다.
LEARNING_RATE_MULTIPLIER(선택사항): 권장 학습률에 적용할 배수. 추천 값을 사용하려면 설정하지 않은 상태로 둡니다.
EXPORT_LAST_CHECKPOINT_ONLY(선택사항) 최신 체크포인트만 사용하도록 true로 설정합니다.
METRIC_SPEC(선택사항): Gen AI Evaluation Service를 사용하여 평가를 실행하는 데 사용하는 측정항목 사양 하나 이상. "pointwise_metric_spec", "pairwise_metric_spec", "exact_match_spec", "bleu_spec", "rouge_spec" 측정항목 사양을 사용할 수 있습니다.
METRIC_SPEC_FIELD_NAME(선택사항): 선택한 측정항목 사양의 필수 필드(예시: "metric_prompt_template")
METRIC_SPEC_FIELD_NAME_CONTENT(선택사항): 선택한 측정항목 사양의 필드 콘텐츠. 예를 들어 점별 평가에 "Evaluate the fluency of this sentence: {response}. Give score from 0 to 1. 0 - not fluent at all. 1 - very fluent." 필드 콘텐츠를 사용할 수 있습니다.
CLOUD_STORAGE_BUCKET(선택사항): Gen AI Evaluation Service에서 실행한 평가의 결과를 저장할 Cloud Storage 버킷
TUNED_MODEL_DISPLAYNAME: (선택사항) 조정된 모델의 표시 이름. 설정하지 않으면 임의의 이름이 생성됩니다.
KMS_KEY_NAME(선택사항): 리소스를 보호하는 데 사용되는 고객 관리 암호화 키의 Cloud KMS 리소스 식별자. 키의 형식은 projects/my-project/locations/my-region/keyRings/my-kr/cryptoKeys/my-key입니다. 키는 컴퓨팅 리소스가 생성된 리전과 동일한 리전에 있어야 합니다. 자세한 내용은 고객 관리 암호화 키(CMEK)를 참조하세요.
SERVICE_ACCOUNT(선택사항): tuningJob 워크로드가 실행되는 서비스 계정. 지정하지 않으면 프로젝트의 Vertex AI 보안 세부 조정 서비스 에이전트가 사용됩니다. 조정 서비스 에이전트를 참조하세요. 고객 관리 서비스 계정을 사용하려면 서비스 계정에 roles/aiplatform.tuningServiceAgent 역할을 부여해야 합니다. 또한 고객 관리 서비스 계정에 조정 서비스 에이전트 roles/iam.serviceAccountTokenCreator 역할을 부여합니다.

HTTP 메서드 및 URL:

POST https://TUNING_JOB_REGION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/TUNING_JOB_REGION/tuningJobs

JSON 요청 본문:

{
  "baseModel": "BASE_MODEL",
  "supervisedTuningSpec" : {
      "trainingDatasetUri": "TRAINING_DATASET_URI",
      "validationDatasetUri": "VALIDATION_DATASET_URI",
      "hyperParameters": {
          "epochCount": "EPOCH_COUNT",
          "adapterSize": "ADAPTER_SIZE",
          "learningRateMultiplier": "LEARNING_RATE_MULTIPLIER"
      },
      "exportLastCheckpointOnly": EXPORT_LAST_CHECKPOINT_ONLY,
      "evaluationConfig": {
          "metrics": [
              {
                  "aggregation_metrics": ["AVERAGE", "STANDARD_DEVIATION"],
                  "METRIC_SPEC": {
                      "METRIC_SPEC_FIELD_NAME":
                          METRIC_SPEC_FIELD_CONTENT
                  }
              },
          ],
          "outputConfig": {
              "gcs_destination": {
                  "output_uri_prefix": "CLOUD_STORAGE_BUCKET"
              }
          },
      },
  },
  "tunedModelDisplayName": "TUNED_MODEL_DISPLAYNAME",
  "encryptionSpec": {
    "kmsKeyName": "KMS_KEY_NAME"
  },
  "serviceAccount": "SERVICE_ACCOUNT"
}

요청을 보내려면 다음 옵션 중 하나를 선택합니다.

curl

참고: 다음 명령어는 gcloud init 또는 gcloud auth login을 실행하거나 gcloud CLI에 자동으로 로그인하는 Cloud Shell을 사용하여 사용자 계정으로 gcloud CLI에 로그인했다고 가정합니다. gcloud auth list를 실행하면 현재 활성 계정을 확인할 수 있습니다.

요청 본문을 request.json 파일에 저장하고 다음 명령어를 실행합니다.

curl -X POST \
     -H "Authorization: Bearer $(gcloud auth print-access-token)" \
     -H "Content-Type: application/json; charset=utf-8" \
     -d @request.json \
     "https://TUNING_JOB_REGION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/TUNING_JOB_REGION/tuningJobs"

PowerShell

참고: 다음 명령어는 gcloud init 또는 gcloud auth login을 실행하여 사용자 계정으로 gcloud CLI에 로그인했다고 가정합니다. gcloud auth list를 실행하면 현재 활성 계정을 확인할 수 있습니다.

요청 본문을 request.json 파일에 저장하고 다음 명령어를 실행합니다.

$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }

Invoke-WebRequest `
    -Method POST `
    -Headers $headers `
    -ContentType: "application/json; charset=utf-8" `
    -InFile request.json `
    -Uri "https://TUNING_JOB_REGION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/TUNING_JOB_REGION/tuningJobs" | Select-Object -Expand Content

다음과 비슷한 JSON 응답이 수신됩니다.

응답

{
  "name": "projects/PROJECT_ID/locations/TUNING_JOB_REGION/tuningJobs/TUNING_JOB_ID",
  "createTime": CREATE_TIME,
  "updateTime": UPDATE_TIME,
  "status": "STATUS",
  "supervisedTuningSpec": {
        "trainingDatasetUri": "TRAINING_DATASET_URI",
        "validationDatasetUri": "VALIDATION_DATASET_URI",
        "hyperParameters": {
            "epochCount": EPOCH_COUNT,
            "adapterSize": "ADAPTER_SIZE",
            "learningRateMultiplier": LEARNING_RATE_MULTIPLIER
        },
    },
  "tunedModelDisplayName": "TUNED_MODEL_DISPLAYNAME",
  "encryptionSpec": {
    "kmsKeyName": "KMS_KEY_NAME"
  },
  "serviceAccount": "SERVICE_ACCOUNT"
}

curl 명령어 예시

PROJECT_ID=myproject
LOCATION=global
curl \
-X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
"https://${LOCATION}-aiplatform.googleapis.com/v1/projects/${PROJECT_ID}/locations/${LOCATION}/tuningJobs" \
-d \
$'{
   "baseModel": "gemini-2.5-flash",
   "supervisedTuningSpec" : {
      "training_dataset_uri": "gs://cloud-samples-data/ai-platform/generative_ai/gemini/text/sft_train_data.jsonl",
      "validation_dataset_uri": "gs://cloud-samples-data/ai-platform/generative_ai/gemini/text/sft_validation_data.jsonl"
   },
   "tunedModelDisplayName": "tuned_gemini"
}'

Colab Enterprise

Colab Enterprise의 측면 패널을 사용하여 Vertex AI에서 모델 조정 작업을 만들 수 있습니다. 측면 패널에서 노트북에 관련 코드 스니펫을 추가합니다. 이후 코드 스니펫을 수정하고 실행하여 조정 작업을 만듭니다. Vertex AI 조정 작업에서 측면 패널을 사용하는 방법에 관한 자세한 내용은 Vertex AI와 상호작용하여 모델 조정을 참조하세요.

Google Cloud 콘솔에서 Colab Enterprise 내 노트북 페이지로 이동합니다.

내 노트북으로 이동
리전 메뉴에서 노트북이 포함된 리전을 선택합니다.
열려는 노트북을 클릭합니다. 노트북을 만들지 않았으면 노트북을 만듭니다.
노트북 오른쪽의 측면 패널에서 튜닝 버튼을 클릭합니다.

측면 패널에 조정 탭이 펼쳐집니다.
Gemini 모델 조정 버튼을 클릭합니다.

Colab Enterprise에서 Gemini 모델을 조정하기 위한 코드 셀을 노트북에 추가합니다.
노트북에서 파라미터 값을 저장하는 코드 셀을 찾습니다. 이러한 파라미터를 사용하여 Vertex AI와 상호작용할 수 있습니다.
다음 파라미터의 값을 업데이트합니다.
- PROJECT_ID: 노트북이 있는 프로젝트의 ID입니다.
- REGION: 노트북이 있는 리전입니다.
- TUNED_MODEL_DISPLAY_NAME: 조정된 모델의 이름입니다.
다음 코드 셀에서 모델 조정 파라미터를 업데이트합니다.
- source_model: 사용할 Gemini 모델입니다(예: gemini-2.0-flash-001).
- train_dataset: 학습 데이터 세트의 URL입니다.
- validation_dataset: 검사 데이터 세트의 URL입니다.
- 필요에 따라 나머지 파라미터를 조정합니다.
측면 패널에서 노트북에 추가한 코드 셀을 실행합니다.
마지막 코드 셀이 실행된 후 표시되는 조정 작업 보기 버튼을 클릭합니다.
측면 패널에 모델 조정 작업에 대한 정보가 표시됩니다.
- 모니터링 탭에는 측정항목이 준비되면 조정 측정항목이 표시됩니다.
- 데이터 세트 탭에는 데이터 세트가 처리된 후 데이터 세트에 관한 요약과 측정항목이 표시됩니다.
- 세부정보 탭에는 조정 방법, 사용한 기본 모델(소스 모델)과 같은 조정 작업에 관한 정보가 표시됩니다.
조정 작업이 완료되면 조정 세부정보 탭에서 모델을 테스트할 수 있는 페이지로 바로 이동할 수 있습니다. 테스트를 클릭합니다.

Google Cloud 콘솔에서 Vertex AI 텍스트 채팅 페이지가 열리며 여기에서 모델을 테스트할 수 있습니다.

초매개변수 조정

하이퍼파라미터를 변경하지 않고 첫 번째 조정 작업을 제출하는 것이 좋습니다. 기본값은 최상의 모델 출력 품질을 얻기 위해 벤치마킹 결과에 따라 권장되는 값입니다.

에포크: 학습 중에 모델이 전체 학습 데이터 세트에서 수행하는 완료 횟수입니다. Vertex AI는 학습 데이터 세트 크기에 맞게 기본값을 자동으로 조정합니다. 이 값은 모델 출력 품질을 최적화하기 위한 벤치마킹 결과를 기반으로 합니다.
어댑터 크기: 조정 작업에 사용할 어댑터 크기. 어댑터 크기는 조정 작업의 학습 가능한 파라미터 수에 영향을 미칩니다. 어댑터 크기가 크면 모델이 더 복잡한 작업을 학습할 수 있음을 의미하지만, 더 큰 학습 데이터 세트와 더 긴 학습 시간이 필요합니다.
학습률 배수: 권장 학습률에 적용할 배수입니다. 값을 늘려 더 빠르게 수렴하거나 값을 줄여 과적합을 방지할 수 있습니다.

지도 미세 조정에 관한 권장사항에 대한 자세한 내용은 Gemini 지도 미세 조정: 권장사항 가이드 블로그 게시물을 참조하세요.

조정 작업 목록 보기

Google Cloud 콘솔, Google 생성형 AI SDK, Vertex AI SDK for Python을 사용하거나 tuningJobs 메서드를 사용하여 GET 요청을 전송하여 현재 프로젝트에서 조정 작업 목록을 볼 수 있습니다.

콘솔

Google Cloud 콘솔에서 조정 작업을 보려면 Vertex AI Studio 페이지로 이동합니다.

Vertex AI Studio로 이동

Gemini 조정 작업은 Gemini Pro 조정된 모델 섹션 아래 표에 나와 있습니다.

Google Gen AI SDK

from google import genai
from google.genai.types import HttpOptions

client = genai.Client(http_options=HttpOptions(api_version="v1"))

responses = client.tunings.list()
for response in responses:
    print(response.name)
    # Example response:
    # projects/123456789012/locations/us-central1/tuningJobs/123456789012345

Vertex AI SDK for Python

import vertexai
from vertexai.tuning import sft

# TODO(developer): Update and un-comment below line
# PROJECT_ID = "your-project-id"
vertexai.init(project=PROJECT_ID, location="us-central1")

responses = sft.SupervisedTuningJob.list()

for response in responses:
    print(response)
# Example response:
# <vertexai.tuning._supervised_tuning.SupervisedTuningJob object at 0x7c85287b2680>
# resource name: projects/12345678/locations/us-central1/tuningJobs/123456789012345

REST

모델 조정 작업 목록을 보려면 tuningJobs.list 메서드를 사용하여 GET 요청을 전송합니다.

요청 데이터를 사용하기 전에 다음을 바꿉니다.

PROJECT_ID: .
TUNING_JOB_REGION: 조정 작업이 실행되는 리전. 또한 조정된 모델이 업로드되는 기본 리전입니다.

HTTP 메서드 및 URL:

GET https://TUNING_JOB_REGION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/TUNING_JOB_REGION/tuningJobs

요청을 보내려면 다음 옵션 중 하나를 선택합니다.

curl

다음 명령어를 실행합니다.

curl -X GET \
     -H "Authorization: Bearer $(gcloud auth print-access-token)" \
     "https://TUNING_JOB_REGION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/TUNING_JOB_REGION/tuningJobs"

PowerShell

다음 명령어를 실행합니다.

$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }

Invoke-WebRequest `
    -Method GET `
    -Headers $headers `
    -Uri "https://TUNING_JOB_REGION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/TUNING_JOB_REGION/tuningJobs" | Select-Object -Expand Content

다음과 비슷한 JSON 응답이 수신됩니다.

응답

{
  "tuning_jobs": [
    TUNING_JOB_1, TUNING_JOB_2, ...
  ]
}

조정 작업의 세부정보 가져오기

Google Cloud 콘솔, Google 생성형 AI SDK, Vertex AI SDK for Python을 사용하거나 tuningJobs 메서드를 사용하여 GET 요청을 전송하여 현재 프로젝트에서 조정 작업의 세부정보를 가져올 수 있습니다.

콘솔

Google Cloud 콘솔에서 조정된 모델의 세부정보를 보려면 Vertex AI 스튜디오 페이지로 이동합니다.

Vertex AI Studio로 이동
Gemini Pro 조정 모델 테이블에서 모델을 찾아 세부정보를 클릭합니다.

모델 세부정보가 표시됩니다.

Google Gen AI SDK

from google import genai
from google.genai.types import HttpOptions

client = genai.Client(http_options=HttpOptions(api_version="v1"))

# Get the tuning job and the tuned model.
# Eg. tuning_job_name = "projects/123456789012/locations/us-central1/tuningJobs/123456789012345"
tuning_job = client.tunings.get(name=tuning_job_name)

print(tuning_job.tuned_model.model)
print(tuning_job.tuned_model.endpoint)
print(tuning_job.experiment)
# Example response:
# projects/123456789012/locations/us-central1/models/1234567890@1
# projects/123456789012/locations/us-central1/endpoints/123456789012345
# projects/123456789012/locations/us-central1/metadataStores/default/contexts/tuning-experiment-2025010112345678

Vertex AI SDK for Python

import vertexai
from vertexai.tuning import sft

# TODO(developer): Update and un-comment below lines
# PROJECT_ID = "your-project-id"
# LOCATION = "us-central1"
vertexai.init(project=PROJECT_ID, location=LOCATION)

tuning_job_id = "4982013113894174720"
response = sft.SupervisedTuningJob(
    f"projects/{PROJECT_ID}/locations/{LOCATION}/tuningJobs/{tuning_job_id}"
)

print(response)
# Example response:
# <vertexai.tuning._supervised_tuning.SupervisedTuningJob object at 0x7cc4bb20baf0>
# resource name: projects/1234567890/locations/us-central1/tuningJobs/4982013113894174720

REST

모델 조정 작업 목록을 보려면 tuningJobs.get 메서드를 사용하여 GET 요청을 전송하고 TuningJob_ID를 지정합니다.

요청 데이터를 사용하기 전에 다음을 바꿉니다.

PROJECT_ID: .
TUNING_JOB_REGION: 조정 작업이 실행되는 리전. 또한 조정된 모델이 업로드되는 기본 리전입니다.
TUNING_JOB_ID: 조정 작업의 ID

HTTP 메서드 및 URL:

GET https://TUNING_JOB_REGION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/TUNING_JOB_REGION/tuningJobs/TUNING_JOB_ID

요청을 보내려면 다음 옵션 중 하나를 선택합니다.

curl

다음 명령어를 실행합니다.

curl -X GET \
     -H "Authorization: Bearer $(gcloud auth print-access-token)" \
     "https://TUNING_JOB_REGION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/TUNING_JOB_REGION/tuningJobs/TUNING_JOB_ID"

PowerShell

다음 명령어를 실행합니다.

$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }

Invoke-WebRequest `
    -Method GET `
    -Headers $headers `
    -Uri "https://TUNING_JOB_REGION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/TUNING_JOB_REGION/tuningJobs/TUNING_JOB_ID" | Select-Object -Expand Content

다음과 비슷한 JSON 응답이 수신됩니다.

응답

{
  "name": "projects/PROJECT_ID/locations/TUNING_JOB_REGION/tuningJobs/TUNING_JOB_ID",
  "tunedModelDisplayName": "TUNED_MODEL_DISPLAYNAME",
  "createTime": CREATE_TIME,
  "endTime": END_TIME,
  "tunedModel": {
      "model": "projects/PROJECT_ID/locations/TUNING_JOB_REGION/models/MODEL_ID",
      "endpoint": "projects/PROJECT_ID/locations/TUNING_JOB_REGION/endpoints/ENDPOINT_ID"
  },
  "experiment": "projects/PROJECT_ID/locations/TUNING_JOB_REGION/metadataStores/default/contexts/EXPERIMENT_ID",
  "tuning_data_statistics": {
      "supervisedTuningDataStats": {
          "tuninDatasetExampleCount": "TUNING_DATASET_EXAMPLE_COUNT",
          "totalBillableTokenCount": "TOTAL_BILLABLE_TOKEN_COUNT",
          "tuningStepCount": "TUNING_STEP_COUNT"
      }
  },
  "status": "STATUS",
  "supervisedTuningSpec" : {
        "trainingDatasetUri": "TRAINING_DATASET_URI",
        "validationDataset_uri": "VALIDATION_DATASET_URI",
        "hyperParameters": {
            "epochCount": EPOCH_COUNT,
            "learningRateMultiplier": LEARNING_RATE_MULTIPLIER
        }
    }
}

조정 작업 취소

Google Cloud 콘솔 또는 Vertex AI SDK for Python을 사용하거나 tuningJobs 메서드를 사용하여 POST 요청을 전송하여 현재 프로젝트에서 조정 작업을 취소할 수 있습니다.

REST

모델 조정 작업 목록을 보려면 tuningJobs.cancel 메서드를 사용하여 GET 요청을 전송하고 TuningJob_ID를 지정합니다.

요청 데이터를 사용하기 전에 다음을 바꿉니다.

PROJECT_ID: .
TUNING_JOB_REGION: 조정 작업이 실행되는 리전. 또한 조정된 모델이 업로드되는 기본 리전입니다.
TUNING_JOB_ID: 조정 작업의 ID

HTTP 메서드 및 URL:

POST https://TUNING_JOB_REGION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/TUNING_JOB_REGION/tuningJobs/TUNING_JOB_ID:cancel

요청을 보내려면 다음 옵션 중 하나를 선택합니다.

curl

다음 명령어를 실행합니다.

curl -X POST \
     -H "Authorization: Bearer $(gcloud auth print-access-token)" \
     -H "Content-Type: application/json; charset=utf-8" \
     -d "" \
     "https://TUNING_JOB_REGION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/TUNING_JOB_REGION/tuningJobs/TUNING_JOB_ID:cancel"

PowerShell

다음 명령어를 실행합니다.

$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }

Invoke-WebRequest `
    -Method POST `
    -Headers $headers `
    -Uri "https://TUNING_JOB_REGION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/TUNING_JOB_REGION/tuningJobs/TUNING_JOB_ID:cancel" | Select-Object -Expand Content

다음과 비슷한 JSON 응답이 수신됩니다.

응답

{}

Vertex AI SDK for Python

import vertexai
from vertexai.tuning import sft

# TODO(developer): Update and un-comment below lines
# PROJECT_ID = "your-project-id"
# LOCATION = "us-central1"
vertexai.init(project=PROJECT_ID, location=LOCATION)

tuning_job_id = "4982013113894174720"
job = sft.SupervisedTuningJob(
    f"projects/{PROJECT_ID}/locations/{LOCATION}/tuningJobs/{tuning_job_id}"
)
job.cancel()

콘솔

Google Cloud 콘솔에서 조정 작업을 취소하려면 Vertex AI Studio 페이지로 이동합니다.

Vertex AI Studio로 이동
Gemini Pro 조정 모델 테이블에서 실행 관리를 클릭합니다.
취소를 클릭합니다.

조정된 모델 평가

조정 작업 후 자동으로 실행되도록 Gen AI Evaluation Service를 구성하지 않은 경우 Vertex AI SDK for Python 또는 Google Gen AI SDK를 사용하거나 generateContent 메서드를 사용해 POST 요청을 전송하여 기본 Gemini와 동일한 방식으로 조정된 모델 엔드포인트와 상호작용할 수 있습니다.

사고 모델의 경우 최적의 성능과 비용 효율성을 위해 조정된 작업에서 사고를 사용 중지하거나 사고 예산을 최소로 설정하는 것이 좋습니다. 지도 미세 조정 중에 모델은 학습을 통해 조정 데이터 세트의 정답을 모방하여 사고 과정을 생략합니다. 따라서 조정된 모델은 사고 예산 없이 작업을 효과적으로 처리할 수 있습니다.

다음 예시에서는 '하늘은 왜 파란색이야?' 질문으로 모델에 프롬프트를 입력합니다.

콘솔

Google Cloud 콘솔에서 조정된 모델의 세부정보를 보려면 Vertex AI 스튜디오 페이지로 이동합니다.

Vertex AI Studio로 이동
Gemini Pro 조정 모델 테이블에서 테스트를 선택합니다.

조정된 모델과의 대화를 만들 수 있는 페이지가 열립니다.

Google Gen AI SDK

from google import genai
from google.genai.types import HttpOptions

client = genai.Client(http_options=HttpOptions(api_version="v1"))

# Get the tuning job and the tuned model.
# Eg. tuning_job_name = "projects/123456789012/locations/us-central1/tuningJobs/123456789012345"
tuning_job = client.tunings.get(name=tuning_job_name)

contents = "Why is the sky blue?"

# Predicts with the tuned endpoint.
response = client.models.generate_content(
    model=tuning_job.tuned_model.endpoint,
    contents=contents,
)
print(response.text)
# Example response:
# The sky is blue because ...

Vertex AI SDK for Python

from vertexai.generative_models import GenerativeModel

sft_tuning_job = sft.SupervisedTuningJob("projects/<PROJECT_ID>/locations/<TUNING_JOB_REGION>/tuningJobs/<TUNING_JOB_ID>")
tuned_model = GenerativeModel(sft_tuning_job.tuned_model_endpoint_name)
print(tuned_model.generate_content(content))

REST

프롬프트로 조정된 모델을 테스트하려면 POST 요청을 전송하고 TUNED_ENDPOINT_ID를 지정합니다.

요청 데이터를 사용하기 전에 다음을 바꿉니다.

PROJECT_ID: .
TUNING_JOB_REGION: 조정 작업이 실행되는 리전. 또한 조정된 모델이 업로드되는 기본 리전입니다.
ENDPOINT_ID: GET API의 조정된 모델 엔드포인트 ID입니다.
TEMPERATURE: 강도는 응답 생성 중 샘플링에 사용되며 topP 및 topK가 적용될 때 발생합니다. 온도는 토큰 선택의 무작위성 수준을 제어합니다. 낮은 온도는 덜 개방적인 또는 덜 창의적인 대답이 필요한 프롬프트에 적합한 반면, 높은 온도는 더 창의적인 대답으로 이어질 수 있습니다. 온도가 0이면 확률이 가장 높은 토큰이 항상 선택됩니다. 이 경우 특정 프롬프트에 대한 응답은 대부분 확정적이지만 여전히 약간의 변형이 가능합니다.
모델이 너무 일반적이거나, 너무 짧은 응답을 반환하거나 모델이 대체 응답을 제공할 경우에는 강도(temperature)를 높여보세요.
TOP_P: Top-P는 모델이 출력용 토큰을 선택하는 방식을 변경합니다. 토큰은 확률의 합이 Top-P 값과 같아질 때까지 확률이 가장 높은 것부터 가장 낮은 것까지 선택됩니다. 예를 들어 토큰 A, B, C의 확률이 0.3, 0.2, 0.1이고 Top-P 값이 0.5이면 모델이 온도를 사용하여 다음 토큰으로 A 또는 B를 선택하고 C를 후보에서 제외합니다.
임의성이 낮은 응답에 낮은 값을 지정하고 임의성이 높은 응답에 높은 값을 지정합니다.
TOP_K: Top-K는 모델이 출력용 토큰을 선택하는 방식을 변경합니다. Top-K가 1이면 선택된 토큰이 모델의 어휘에 포함된 모든 토큰 중에서 가장 확률이 높다는 의미입니다(그리디 디코딩이라고도 함). 반면에 Top-K가 3이면 강도를 사용하여 가장 확률이 높은 3개 토큰 중에서 다음 토큰이 선택된다는 의미입니다.
각 토큰 선택 단계에서 확률이 가장 높은 Top-K 토큰이 샘플링됩니다. 그런 다음 Top-P를 기준으로 토큰을 추가로 필터링하고 온도 샘플링을 사용하여 최종 토큰을 선택합니다.

임의성이 낮은 응답에 낮은 값을 지정하고 임의성이 높은 응답에 높은 값을 지정합니다.
MAX_OUTPUT_TOKENS: 응답에서 생성될 수 있는 토큰의 최대 개수. 토큰은 약 4자(영문 기준)입니다. 토큰 100개는 단어 약 60~80개에 해당합니다.
응답이 짧을수록 낮은 값을 지정하고 잠재적으로 응답이 길면 높은 값을 지정합니다.

HTTP 메서드 및 URL:

POST https://TUNING_JOB_REGION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/TUNING_JOB_REGION/endpoints/ENDPOINT_ID:generateContent

JSON 요청 본문:

{
    "contents": [
        {
            "role": "USER",
            "parts": {
                "text" : "Why is sky blue?"
            }
        }
    ],
    "generation_config": {
        "temperature":TEMPERATURE,
        "topP": TOP_P,
        "topK": TOP_K,
        "maxOutputTokens": MAX_OUTPUT_TOKENS
    }
}

요청을 보내려면 다음 옵션 중 하나를 선택합니다.

curl

요청 본문을 request.json 파일에 저장하고 다음 명령어를 실행합니다.

curl -X POST \
     -H "Authorization: Bearer $(gcloud auth print-access-token)" \
     -H "Content-Type: application/json; charset=utf-8" \
     -d @request.json \
     "https://TUNING_JOB_REGION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/TUNING_JOB_REGION/endpoints/ENDPOINT_ID:generateContent"

PowerShell

요청 본문을 request.json 파일에 저장하고 다음 명령어를 실행합니다.

$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }

Invoke-WebRequest `
    -Method POST `
    -Headers $headers `
    -ContentType: "application/json; charset=utf-8" `
    -InFile request.json `
    -Uri "https://TUNING_JOB_REGION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/TUNING_JOB_REGION/endpoints/ENDPOINT_ID:generateContent" | Select-Object -Expand Content

다음과 비슷한 JSON 응답이 수신됩니다.

응답

{
  "candidates": [
    {
      "content": {
        "role": "model",
        "parts": [Why is sky blue?
          {
            "text": "The sky appears blue due to a phenomenon called Rayleigh scattering, where shorter blue wavelengths of sunlight are scattered more strongly by the Earth's atmosphere than longer red wavelengths."
          }
        ]
      },
      "finishReason": "STOP",
      "safetyRatings": [
        {
          "category": "HARM_CATEGORY_HATE_SPEECH",
          "probability": "NEGLIGIBLE",
          "probabilityScore": 0.06325052,
          "severity": "HARM_SEVERITY_NEGLIGIBLE",
          "severityScore": 0.03179867
        },
        {
          "category": "HARM_CATEGORY_DANGEROUS_CONTENT",
          "probability": "NEGLIGIBLE",
          "probabilityScore": 0.09334688,
          "severity": "HARM_SEVERITY_NEGLIGIBLE",
          "severityScore": 0.027742893
        },
        {
          "category": "HARM_CATEGORY_HARASSMENT",
          "probability": "NEGLIGIBLE",
          "probabilityScore": 0.17356819,
          "severity": "HARM_SEVERITY_NEGLIGIBLE",
          "severityScore": 0.025419652
        },
        {
          "category": "HARM_CATEGORY_SEXUALLY_EXPLICIT",
          "probability": "NEGLIGIBLE",
          "probabilityScore": 0.07864238,
          "severity": "HARM_SEVERITY_NEGLIGIBLE",
          "severityScore": 0.020332353
        }
      ]
    }
  ],
  "usageMetadata": {
    "promptTokenCount": 5,
    "candidatesTokenCount": 33,
    "totalTokenCount": 38
  }
}

조정된 모델 삭제

조정된 모델을 삭제하려면 다음 단계를 따르세요.

REST

models.delete 메서드를 호출합니다.

요청 데이터를 사용하기 전에 다음을 바꿉니다.

PROJECT_ID: .
REGION: 조정된 모델이 있는 리전입니다.
MODEL_ID: 삭제할 모델입니다.

HTTP 메서드 및 URL:

DELETE https://REGION-aiplatform.googleapis.com/v1beta1/projects/PROJECT_ID/locations/REGION/models/MODEL_ID

요청을 보내려면 다음 옵션 중 하나를 선택합니다.

curl

다음 명령어를 실행합니다.

curl -X DELETE \
     -H "Authorization: Bearer $(gcloud auth print-access-token)" \
     "https://REGION-aiplatform.googleapis.com/v1beta1/projects/PROJECT_ID/locations/REGION/models/MODEL_ID"

PowerShell

다음 명령어를 실행합니다.

$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }

Invoke-WebRequest `
    -Method DELETE `
    -Headers $headers `
    -Uri "https://REGION-aiplatform.googleapis.com/v1beta1/projects/PROJECT_ID/locations/REGION/models/MODEL_ID" | Select-Object -Expand Content

성공 상태 코드(2xx)와 빈 응답을 받게 됩니다.

Vertex AI SDK for Python

from google.cloud import aiplatform

aiplatform.init(project=PROJECT_ID, location=LOCATION)

# To find out which models are available in Model Registry
models = aiplatform.Model.list()

model = aiplatform.Model(MODEL_ID)
model.delete()

조정 및 검사 측정항목

모델 조정 작업을 구성하여 모델 조정 및 모델 평가 측정항목을 수집하고 보고할 수 있으며 이를 Vertex AI Studio에서 시각화할 수 있습니다.

Google Cloud 콘솔에서 조정된 모델의 세부정보를 보려면 Vertex AI 스튜디오 페이지로 이동합니다.

Vertex AI Studio로 이동
조정 및 증류 테이블에서 측정항목을 보려는 조정된 모델의 이름을 클릭합니다.

조정 측정항목은 모니터링 탭 아래에 표시됩니다.

모델 조정 측정항목

모델 조정 작업은 Gemini 2.0 Flash에 대해 다음 조정 측정항목을 자동으로 수집합니다.

/train_total_loss: 학습 단계의 조정 데이터 세트 손실
/train_fraction_of_correct_next_step_preds: 학습 단계의 토큰 정확성. 단일 예측은 일련의 토큰으로 구성됩니다. 이 측정항목은 조정 데이터 세트의 정답과 비교할 때 예측된 토큰의 정확도를 측정합니다.
/train_num_predictions: 학습 단계에서 예측된 토큰 수

모델 검증 측정항목

Gemini 2.0 Flash에 대해 다음 검사 측정항목을 수집하도록 모델 조정 작업을 구성할 수 있습니다.

/eval_total_loss: 검사 단계의 검사 데이터 세트 손실
/eval_fraction_of_correct_next_step_preds: 검증 단계의 토큰 정확성. 단일 예측은 일련의 토큰으로 구성됩니다. 이 측정항목은 검증 데이터 세트의 정답과 비교할 때 예측된 토큰의 정확도를 측정합니다.
/eval_num_predictions: 검증 단계에서 예측된 토큰 수

조정 작업이 실행되기 시작하면 측정항목 시각화를 사용할 수 있습니다. 조정이 진행되면 실시간으로 업데이트됩니다. 조정 작업을 만들 때 검증 데이터 세트를 지정하지 않으면 조정 측정항목의 시각화만 제공됩니다.

다음 단계

조정된 Gemini 모델 배포에 대해 알아보기
생성형 AI 기술 자료를 구축하는 솔루션에서 지도 세부 조정을 사용하는 방법을 알아보려면 점프 스타트 솔루션: 생성형 AI 기술 자료 참고하기
Vertex AI 지도 미세 조정을 사용하여 생성형 AI 모델을 미세 조정하는 방법 알아보기