Vertex AI の Imagen のアップスケーリング機能を使用すると、画質を損なうことなく画像のサイズを大きくできます。
モデル バージョン
アップスケーリングの可用性はモデル バージョンによって異なります。
| 機能 | Imagen(v.002) | Imagen 2(v.005) | Imagen 2(v.006) |
|---|---|---|---|
| アップスケーリング | ✔ | サポートされていません | 非対応 |
画像をアップスケールする
次のコードサンプルを使用して、既存の画像、生成された画像、または編集された画像をアップスケールします。
コンソール
テキスト付きの画像を生成するの手順に沿って画像を生成します。
アップスケールする画像を選択します。
[アップスケール/エクスポート] をクリックします。
[画像をアップスケール] を選択します。
[スケーリング ファクタ] から値を選択します(
2xまたは4x)。[エクスポート] をクリックして、スケールアップされた画像を保存します。
REST
imagegeneration モデル リクエストの詳細については、imagegeneration モデル API リファレンスをご覧ください。
アップスケーリング モードは、JSON リクエスト本文の parameters オブジェクト内にあるオプション フィールドです。API を使用して画像をアップスケールする場合は、"mode": "upscale" と upscaleConfig を指定します。
リクエストのデータを使用する前に、次のように置き換えます。
- LOCATION: プロジェクトのリージョン。たとえば、
us-central1、europe-west2、asia-northeast3です。使用可能なリージョンの一覧については、Vertex AI の生成 AI のロケーションをご覧ください。 - PROJECT_ID: 実際の Google Cloud プロジェクト ID。
- B64_BASE_IMAGE: 編集またはアップスケールするベース画像。画像は base64 でエンコードされたバイト文字列として指定する必要があります。サイズの上限: 10 MB。
- IMAGE_SOURCE: 編集またはアップスケールする画像の Cloud Storage ロケーション。例:
gs://output-bucket/source-photos/photo.png - UPSCALE_FACTOR: 省略可。画像をアップスケールする係数。指定しない場合、アップスケール係数は入力画像の長辺と
sampleImageSizeから決定されます。使用可能な値:x2またはx4。
HTTP メソッドと URL:
POST https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/imagegeneration@002:predict
リクエストの本文(JSON):
{
"instances": [
{
"prompt": "",
"image": {
// use one of the following to specify the image to upscale
"bytesBase64Encoded": "B64_BASE_IMAGE"
"gcsUri": "IMAGE_SOURCE"
// end of base image input options
},
}
],
"parameters": {
"sampleCount": 1,
"mode": "upscale",
"upscaleConfig": {
"upscaleFactor": "UPSCALE_FACTOR"
}
}
}
リクエストを送信するには、次のいずれかのオプションを選択します。
curl
リクエスト本文を request.json という名前のファイルに保存して、次のコマンドを実行します。
curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/imagegeneration@002:predict"
PowerShell
リクエスト本文を request.json という名前のファイルに保存して、次のコマンドを実行します。
$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }
Invoke-WebRequest `
-Method POST `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/imagegeneration@002:predict" | Select-Object -Expand Content
次のような JSON レスポンスが返されます。
{
"predictions": [
{
"mimeType": "image/png",
"bytesBase64Encoded": "iVBOR..[base64-encoded-upscaled-image]...YII="
}
]
}
次のステップ
Imagen や Vertex AI のその他の生成 AI プロダクトに関する次の記事を読む。
- Vertex AI で Imagen 3 を使い始めるためのデベロッパー ガイド
- クリエイターとともにクリエイターのために構築された、新しい生成メディアのモデルとツール
- Gemini の新機能: カスタム Gem と Imagen 3 による画像生成の改善
- Google DeepMind: Imagen 3 - 最も高い品質水準の Text-to-Image モデル