Vertex AI の Imagen のアップスケーリング機能を使用すると、画質を損なうことなく画像のサイズを大きくできます。
モデル バージョン
アップスケーリングの可用性はモデル バージョンによって異なります。
特徴 | Imagen(v.002) | Imagen 2(v.005) | Imagen 2(v.006) |
---|---|---|---|
アップスケーリング | ✔ | 非対応 | 非対応 |
画像をアップスケールする
次のコードサンプルを使用して、既存の、または生成または編集された画像をアップスケールします。
Console
テキスト付きの画像を生成するの手順に沿って画像を生成します。
アップスケールする画像を選択します。
[
アップスケール/エクスポート] をクリックします。[Upscale images] を選択します。
[Scale factor] から値を選択します(
2x
または4x
)。[
Export] をクリックして、スケールアップされた画像を保存します。
REST
imagegeneration
モデル リクエストの詳細については、imagegeneration
モデル API リファレンスをご覧ください。
アップスケーリング モードは、JSON リクエスト本文の parameters
オブジェクト内にあるオプション フィールドです。API を使用して画像をアップスケールする場合は、"mode": "upscale"
と upscaleConfig
を指定します。
リクエストのデータを使用する前に、次のように置き換えます。
- LOCATION: プロジェクトのリージョン。 たとえば、
us-central1
、europe-west2
、またはasia-northeast3
です。使用可能なリージョンの一覧については、Vertex AI の生成 AI のロケーション をご覧ください。 - PROJECT_ID: Google Cloud プロジェクト ID。
- B64_BASE_IMAGE: 編集またはアップスケールするベース画像。画像は base64 でエンコードされたバイト文字列として指定する必要があります。サイズ制限: 10 MB。
- IMAGE_SOURCE: 編集またはアップスケールする画像の Cloud Storage ロケーション。例:
gs://output-bucket/source-photos/photo.png
- UPSCALE_FACTOR: 省略可。画像をアップスケールする係数。指定しない場合、アップスケール係数は入力画像の長辺と
sampleImageSize
から決定されます。使用可能な値:x2
またはx4
。
HTTP メソッドと URL:
POST https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/imagegeneration@002:predict
リクエストの本文(JSON):
{ "instances": [ { "prompt": "", "image": { // use one of the following to specify the image to upscale "bytesBase64Encoded": "B64_BASE_IMAGE" "gcsUri": "IMAGE_SOURCE" // end of base image input options }, } ], "parameters": { "sampleCount": 1, "mode": "upscale", "upscaleConfig": { "upscaleFactor": "UPSCALE_FACTOR" } } }
リクエストを送信するには、次のいずれかのオプションを選択します。
curl
リクエスト本文を request.json
という名前のファイルに保存して、次のコマンドを実行します。
curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/imagegeneration@002:predict"
PowerShell
リクエスト本文を request.json
という名前のファイルに保存して、次のコマンドを実行します。
$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }
Invoke-WebRequest `
-Method POST `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/imagegeneration@002:predict" | Select-Object -Expand Content
次のような JSON レスポンスが返されます。
{ "predictions": [ { "mimeType": "image/png", "bytesBase64Encoded": "iVBOR..[base64-encoded-upscaled-image]...YII=" } ] }
次のステップ
Imagen や Vertex AI のその他の生成 AI プロダクトに関する次の記事を読む。
- Vertex AI で Imagen 3 を使い始めるためのデベロッパー ガイド
- クリエイターとともにクリエイターのために構築された、新しい生成メディアのモデルとツール
- Gemini の新機能: カスタム Gem と Imagen 3 による画像生成の改善
- Google DeepMind: Imagen 3 - 最も高い品質水準の Text-to-Image モデル