생성, 수정된 이미지 또는 기존 이미지 확대

Imagen on Vertex AI의 확장 기능을 사용하면 품질 손실 없이 이미지 크기를 늘릴 수 있습니다.

모델 버전

업스케일링 사용 가능 여부는 모델 버전을 기준으로 합니다.

특성 Imagen(v.002) Imagen 2(v.005) Imagen 2(v.006)
업스케일링 지원되지 않음 지원되지 않음

이미지 확대

다음 코드 샘플을 사용하여 기존 이미지, 생성 또는 수정된 이미지를 확장합니다.

콘솔

  1. 텍스트로 이미지 생성 안내에 따라 이미지를 생성합니다.

  2. 확대할 이미지를 선택합니다.

  3. 업스케일링/내보내기를 클릭합니다.

  4. 이미지 확대를 선택합니다.

  5. 배율에서 값을 선택합니다(2x 또는 4x).

  6. 내보내기를 클릭하여 확대한 이미지를 저장합니다.

REST

imagegeneration 모델 요청에 대한 자세한 내용은 imagegeneration 모델 API 참조를 확인하세요.

확장 모드는 JSON 요청 본문의 parameters 객체에 있는 선택적 필드입니다. API를 사용하여 이미지를 확장하는 경우 "mode": "upscale"upscaleConfig를 지정하세요.

요청 데이터를 사용하기 전에 다음을 바꿉니다.

  • LOCATION: 프로젝트의 리전입니다. 예를 들면 us-central1, europe-west2, asia-northeast3입니다. 사용 가능한 리전 목록은 Vertex AI의 생성형 AI 위치를 참조하세요.
  • PROJECT_ID: Google Cloud 프로젝트 ID입니다.
  • B64_BASE_IMAGE: 수정하거나 확대할 기본 이미지입니다. 이미지는 base64 인코딩 바이트 문자열로 지정되어야 합니다. 크기 제한: 10MB.
  • IMAGE_SOURCE: 수정하거나 확대할 이미지의 Cloud Storage 위치입니다. 예를 들면 gs://output-bucket/source-photos/photo.png입니다.
  • UPSCALE_FACTOR: (선택사항) 이미지를 확대할 배율입니다. 지정하지 않으면 확대 배율은 입력 이미지의 더 긴 쪽과 sampleImageSize에서 결정됩니다. 사용 가능한 값: x2 또는 x4.

HTTP 메서드 및 URL:

POST https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/imagegeneration@002:predict

JSON 요청 본문:

{
  "instances": [
    {
      "prompt": "",
      "image": {
        // use one of the following to specify the image to upscale
        "bytesBase64Encoded": "B64_BASE_IMAGE"
        "gcsUri": "IMAGE_SOURCE"
        // end of base image input options
      },
    }
  ],
  "parameters": {
    "sampleCount": 1,
    "mode": "upscale",
    "upscaleConfig": {
      "upscaleFactor": "UPSCALE_FACTOR"
    }
  }
}

요청을 보내려면 다음 옵션 중 하나를 선택합니다.

curl

요청 본문을 request.json 파일에 저장하고 다음 명령어를 실행합니다.

curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/imagegeneration@002:predict"

PowerShell

요청 본문을 request.json 파일에 저장하고 다음 명령어를 실행합니다.

$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }

Invoke-WebRequest `
-Method POST `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/imagegeneration@002:predict" | Select-Object -Expand Content

다음과 비슷한 JSON 응답이 표시됩니다.

{
  "predictions": [
    {
      "mimeType": "image/png",
      "bytesBase64Encoded": "iVBOR..[base64-encoded-upscaled-image]...YII="
    }
  ]
}

다음 단계