本頁面由 Cloud Translation API 翻譯而成。

受控自訂

注意：自 2025 年 6 月 24 日起，Imagen 第 1 版和第 2 版將淘汰。Imagen 模型 imagegeneration@002、imagegeneration@005 和 imagegeneration@006 將於 2025 年 9 月 24 日移除。如要進一步瞭解如何遷移至 Imagen 3，請參閱「遷移至 Imagen 3」。

「受控自訂」功能可讓您根據來源圖片或來源圖片信號 (Canny Edge 或塗鴉) 建立新圖片。本頁說明如何傳送兩種受控自訂要求：

Imagen 3 受控自訂 (正式版功能)

查看「Imagen for Editing and Customization」模型資訊卡
Imagen 2 受控自訂功能 - Canny 邊緣或塗鴉來源圖片信號 (預覽功能)

用途

Imagen 3 Controlled Customization 提供自由風格的提示，可能會讓您覺得模型的功能超出訓練範圍。以下各節將說明 Imagen 3 Controlled Customization 的應用實例和範例。

這個模型已根據我們提供的用途進行訓練，因此我們預期您在使用 Imagen 3 受控自訂功能時，會獲得良好的結果。如果要求模型以出乎意料的方式回覆，我們預期不會得到良好的結果。

預定用途範例

Imagen 3 Controlled Customization 經過訓練，可處理下列應用實例，並產生良好結果：

生成符合提示和 Canny 邊緣控制項圖片的圖片。
生成符合提示和塗鴉圖像的圖片。
為人物相片套用風格，同時保留臉部表情。

不當用途範例

Imagen 3 Controlled Customization 未經過訓練，因此無法處理下列應用實例，且會產生品質不佳的結果：

根據提示中指定的風格生成圖片。
從文字生成圖片，並根據參考圖片提供特定風格，同時使用控制圖片在某種程度上控制圖片構圖。
根據參考圖片提供的特定風格，透過文字生成圖像，並使用控制塗鴉，在某種程度上控制圖像構圖。
從文字生成圖片，並遵循參考圖片提供的特定風格，同時使用控制圖片，在某種程度上控制圖片構圖。圖片中的人有特定臉部表情。
為兩張以上的人像相片套用風格，並保留臉部表情。
將寵物相片轉換為手繪風格，保留或指定圖片的構圖 (例如水彩)。

事前準備

Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.

In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

Roles required to select or create a project

Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
Create a project: To create a project, you need the Project Creator (roles/resourcemanager.projectCreator), which contains the resourcemanager.projects.create permission. Learn how to grant roles.

Go to project selector

Verify that billing is enabled for your Google Cloud project.

Enable the Vertex AI API.

Roles required to enable APIs

To enable APIs, you need the Service Usage Admin IAM role (roles/serviceusage.serviceUsageAdmin), which contains the serviceusage.services.enable permission. Learn how to grant roles.

Enable the API

In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

Roles required to select or create a project

Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
Create a project: To create a project, you need the Project Creator (roles/resourcemanager.projectCreator), which contains the resourcemanager.projects.create permission. Learn how to grant roles.

Go to project selector

Verify that billing is enabled for your Google Cloud project.

Enable the Vertex AI API.

Roles required to enable APIs

To enable APIs, you need the Service Usage Admin IAM role (roles/serviceusage.serviceUsageAdmin), which contains the serviceusage.services.enable permission. Learn how to grant roles.

Enable the API

為環境設定驗證方法。

Select the tab for how you plan to use the samples on this page:

Console

When you use the Google Cloud console to access Google Cloud services and APIs, you don't need to set up authentication.

REST

如要在本機開發環境中使用本頁的 REST API 範例，請使用您提供給 gcloud CLI 的憑證。

安裝 Google Cloud CLI。安裝完成後，執行下列指令初始化 Google Cloud CLI：

gcloud init

如果您使用外部識別資訊提供者 (IdP)，請先使用聯合身分登入 gcloud CLI。

詳情請參閱 Google Cloud 驗證說明文件中的「Authenticate for using REST」。

撰寫自訂提示

使用 Imagen 3 自訂功能時，提示可能會影響生成的圖片品質。您可以從下列提示範本著手撰寫自訂提示。您可能需要傳送多個要求，才能取得目標輸出內容。

用途	參考圖片	提示範本	範例
控管自訂項目	手繪地圖 (1)	生成符合 `scribble map [1]` 的圖片，與說明相符：${STYLE_PROMPT} ${PROMPT}。	生成符合 `scribble map [1]` 的圖片，與說明相符：圖片應為印象派油畫風格，筆觸輕鬆。這類照片通常有自然光線，且筆觸明顯。車輛的側面圖。車輛停在潮濕且會反射光線的路面上，水窪中映照著城市燈光。
控管自訂項目	Canny 控制圖片 (1)	生成與 `edge map [1]` 相符的圖片，以符合說明：${STYLE_PROMPT} ${PROMPT}	生成符合 `edge map [1]` 的圖片，與說明相符：圖片應為印象派油畫風格，筆觸輕鬆。這類圖片的氛圍自然明亮，筆觸也十分明顯。車輛的側面圖。車輛停在潮濕且會反射光線的路面，水窪中映照著城市燈光。
使用 FaceMesh 輸入內容，為人物圖片套用風格	主體圖片 (1-3) FaceMesh 控制圖片 (1)	以`SUBJECT_DESCRIPTION [1]`的姿勢建立`CONTROL_IMAGE [2]`圖片，符合以下說明：`SUBJECT_DESCRIPTION [1]`的肖像照 ${PROMPT}	以`control image [2]`的姿勢繪製「`a woman with short hair [1]`」的圖片，符合以下描述：`a woman with short hair [1]`的肖像照，採用 3D 卡通風格，背景模糊。可愛的角色，面帶微笑，面向鏡頭，色調柔和，高品質，4K，傑作，細節豐富，皮膚紋理，紋理對應，柔和陰影，柔和逼真的光線，鮮豔色彩
使用 FaceMesh 輸入內容，為人物圖片套用風格	主體圖片 (1-3) FaceMesh 控制圖片 (1)	建立 ${STYLE_PROMPT} 圖片，內容為 `SUBJECT_DESCRIPTION [1]`，姿勢為 `CONTROL_IMAGE [2]`，與以下說明相符：`SUBJECT_DESCRIPTION [1]` 的肖像照${PROMPT}	以 3D 卡通風格繪製 `a woman with short hair [1]` 的圖片，姿勢要與 `control image [2]` 相同，並符合以下說明：`a woman with short hair [1]` 的肖像照，以 3D 卡通風格呈現，背景模糊。可愛的角色，面帶微笑，面向鏡頭，粉彩色調，高品質，4K，傑作，超級細節，皮膚紋理，紋理對應，柔和陰影，柔和逼真的光線，鮮豔色彩

傳送 Imagen 3 受控自訂要求

請使用下列範例傳送 Imagen 3 Controlled Customization 要求：

REST

使用任何要求資料之前，請先替換以下項目：

PROJECT_ID：您的 Google Cloud 專案 ID。
LOCATION：專案的區域。例如 us-central1、europe-west2 或 asia-northeast3。如需可用區域的清單，請參閱「Vertex AI 的生成式 AI 服務地區」。
TEXT_PROMPT：文字提示會引導模型生成圖片。如要使用 Imagen 3 受控自訂功能，請以 [$referenceId] 格式加入您提供的控制參考圖片 referenceId。例如：
- 生成與塗鴉地圖相符的圖片 [1]，並與說明相符： [image description]。
BASE64_CONTROL_IMAGE：基礎控制圖片 (草圖)。圖片必須指定為 base64 編碼的位元組字串。
對於 CONTROL_TYPE_SCRIBBLE：預期的塗鴉控制項圖片應為黑色背景和白色塗鴉線。
適用於 CONTROL_TYPE_CANNY：預期的 Canny 邊緣控制圖片應為黑底白邊。
CONTROL_TYPE：控制信號的類型。使用 CONTROL_TYPE_CANNY 進行 Canny 邊緣偵測。使用 CONTROL_TYPE_SCRIBBLE 塗鴉。
enableControlImageComputation：如果您提供自己的控制圖片，請設為 false。在這種情況下，B64_BASE_IMAGE 應為控制訊號圖片。如要讓 Imagen 從參照圖片計算控制圖片，請設為 true。在這種情況下，B64_BASE_IMAGE 應為原始 RGB 圖片。
IMAGE_COUNT：生成的圖像數量。接受的整數值：1 到 4。預設值：4。

HTTP 方法和網址：

POST https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/imagen-3.0-capability-001:predict

JSON 要求主體：

{
  "instances": [
    {
      "prompt": "TEXT_PROMPT",
      "referenceImages": [
        {
          "referenceType": "REFERENCE_TYPE_CONTROL",
          "referenceId": 1,
          "referenceImage": {
            "bytesBase64Encoded": "BASE64_CONTROL_IMAGE"
          },
          "controlImageConfig": {
            "controlType": "CONTROL_TYPE",
            "enableControlImageComputation": false
          }
        }
      ]
    }
  ],
  "parameters": {
    "sampleCount": IMAGE_COUNT
  }
}

如要傳送要求，請選擇以下其中一個選項：

curl

注意： 下列指令假設您已執行 gcloud init 或 gcloud auth login，透過使用者帳戶登入 gcloud CLI，或使用 Cloud Shell，自動登入 gcloud CLI。您可以執行 gcloud auth list 查看目前有效的帳戶。

將要求主體儲存在名為 request.json 的檔案中，然後執行下列指令：

curl -X POST \
     -H "Authorization: Bearer $(gcloud auth print-access-token)" \
     -H "Content-Type: application/json; charset=utf-8" \
     -d @request.json \
     "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/imagen-3.0-capability-001:predict"

PowerShell

注意： 下列指令假設您已執行 gcloud init 或 gcloud auth login，透過使用者帳戶登入 gcloud CLI。您可以執行 gcloud auth list 查看目前有效的帳戶。

將要求主體儲存在名為 request.json 的檔案中，然後執行下列指令：

$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }

Invoke-WebRequest `
    -Method POST `
    -Headers $headers `
    -ContentType: "application/json; charset=utf-8" `
    -InFile request.json `
    -Uri "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/imagen-3.0-capability-001:predict" | Select-Object -Expand Content

以下是含有 "sampleCount": 2 的要求範例回應。回應會傳回兩個預測物件，其中包含以 base64 編碼產生的圖片位元組。

{
  "predictions": [
    {
      "bytesBase64Encoded": "BASE64_IMG_BYTES",
      "mimeType": "image/png"
    },
    {
      "mimeType": "image/png",
      "bytesBase64Encoded": "BASE64_IMG_BYTES"
    }
  ]
}

Python

塗鴉

from google import genai
from google.genai.types import (
    ControlReferenceConfig,
    ControlReferenceImage,
    EditImageConfig,
    Image,
)

client = genai.Client()

# TODO(developer): Update and un-comment below line
# output_gcs_uri = "gs://your-bucket/your-prefix"

# Create a reference image out of an existing scribble image signal
# using https://storage.googleapis.com/cloud-samples-data/generative-ai/image/car_scribble.png
control_reference_image = ControlReferenceImage(
    reference_id=1,
    reference_image=Image(gcs_uri="gs://cloud-samples-data/generative-ai/image/car_scribble.png"),
    config=ControlReferenceConfig(control_type="CONTROL_TYPE_SCRIBBLE"),
)

image = client.models.edit_image(
    model="imagen-3.0-capability-001",
    prompt="an oil painting showing the side of a red car[1]",
    reference_images=[control_reference_image],
    config=EditImageConfig(
        edit_mode="EDIT_MODE_CONTROLLED_EDITING",
        number_of_images=1,
        safety_filter_level="BLOCK_MEDIUM_AND_ABOVE",
        person_generation="ALLOW_ADULT",
        output_gcs_uri=output_gcs_uri,
    ),
)

# Example response:
# gs://your-bucket/your-prefix
print(image.generated_images[0].image.gcs_uri)

Canny 邊緣

from google import genai
from google.genai.types import (
    ControlReferenceConfig,
    ControlReferenceImage,
    EditImageConfig,
    Image,
)

client = genai.Client()

# TODO(developer): Update and un-comment below line
# output_gcs_uri = "gs://your-bucket/your-prefix"

# Create a reference image out of an existing canny edge image signal
# using https://storage.googleapis.com/cloud-samples-data/generative-ai/image/car_canny.png
control_reference_image = ControlReferenceImage(
    reference_id=1,
    reference_image=Image(gcs_uri="gs://cloud-samples-data/generative-ai/image/car_canny.png"),
    config=ControlReferenceConfig(control_type="CONTROL_TYPE_CANNY"),
)

image = client.models.edit_image(
    model="imagen-3.0-capability-001",
    prompt="a watercolor painting of a red car[1] driving on a road",
    reference_images=[control_reference_image],
    config=EditImageConfig(
        edit_mode="EDIT_MODE_CONTROLLED_EDITING",
        number_of_images=1,
        safety_filter_level="BLOCK_MEDIUM_AND_ABOVE",
        person_generation="ALLOW_ADULT",
        output_gcs_uri=output_gcs_uri,
    ),
)

# Example response:
# gs://your-bucket/your-prefix
print(image.generated_images[0].image.gcs_uri)

傳送 Imagen 2 受控自訂要求

輸入圖像	其他參數	輸出圖片
輸入圖片。圖片來源：Alec Cutter (Unsplash)。	提示：「數位藝術版」負面提示：「黑白」導覽圖片類型：標準 RGB 控制條件：canny edge Imagen Control 比例：0.95
輸入圖片。圖片來源：Alec Cutter (Unsplash 上的圖片，已套用 Canny 邊緣偵測)。	提示：「數位藝術版」負面提示：「黑白」引導圖片類型：canny edge Imagen Control 比例：0.95

輸入圖像

其他參數

輸出圖片

輸入圖片。圖片來源：Alec Cutter (Unsplash)。

提示：「數位藝術版」

負面提示：「黑白」

導覽圖片類型：標準 RGB

控制條件：canny edge

Imagen Control 比例：0.95

輸入圖片。圖片來源：Alec Cutter (Unsplash 上的圖片，已套用 Canny 邊緣偵測)。

提示：「數位藝術版」

負面提示：「黑白」

引導圖片類型：canny edge

Imagen Control 比例：0.95

請使用下列範例傳送 Imagen 2 受控自訂要求：

控制台

在 Google Cloud 控制台中，前往「Vertex AI」 >「Media Studio」頁面。

前往媒體工作室
在下方工作面板中，按一下「編輯圖片」。
按一下「上傳」，選取要編輯的本機圖片。
在「參數」面板的「模式」部分，按一下「控制」。
(選用步驟) 修改「結果數量」、提供「負面提示」，或修改「進階選項」>「區域」。
在「Advanced options」(進階選項) 區段中，選取「Guide image type」(引導圖片類型)：Standard RGB、 Canny edge 或 Scribble。
在「Advanced options」(進階選項) 區段中，選取「Control condition」(控制條件)：Canny edge 或 Scribble。
在提示欄位 (「撰寫提示詞...」) 中，提供文字提示。
按一下「生成」。

REST

使用任何要求資料之前，請先替換以下項目：

PROJECT_ID：您的 Google Cloud 專案 ID。
TEXT_PROMPT：文字提示，引導模型生成圖片。生成和編輯時都必須填寫這個欄位。
B64_BASE_IMAGE：要編輯或放大畫質的基礎圖片。圖片必須指定為 base64 編碼的位元組字串。大小限制：10 MB。
EDIT_IMAGE_COUNT：編輯的圖片數量。預設值： 4。
NEGATIVE_PROMPT：用於生成圖片的負面提示。例如：「動物」(移除動物)、「模糊」(讓圖片更清晰)、「文字」(移除文字) 或「裁剪」(移除裁剪的圖片)。
CONDITION：string。提供的控制項圖片信號類型。值： cannyEdges 或 scribble。
CONTROL_SCALE：float。控制圖片訊號的強度。值： 0.0 - 1.0。預設值為 0.95。建議範圍： 0.9 - 1.0。
SAMPLING_STEPS：integer。取樣步數。值： 1 - 30。預設值：16。
COMPUTE_CONDITION_MAP：boolean。是否要根據基本輸入圖片計算條件對應。設為 false 時，服務會預期輸入圖片為塗鴉或 Canny 邊緣，並直接提供給模型。如果設為 true，服務會將輸入圖片視為 RGB 圖片，並根據 conditionName 從輸入圖片計算 Canny 邊緣或塗鴉資訊。接著，這項服務會將處理過的條件對應關係提供給模型，以進行圖片編輯。提供塗鴉圖片時，圖片應為黑底，並以白線描繪要生成的物件。預設值：false。

HTTP 方法和網址：

POST https://us-central1-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/us-central1/publishers/google/models/imagen-2.0-edit-preview-0627:predict

JSON 要求主體：

{
  "instances": [
    {
      "prompt": "TEXT_PROMPT",
      "image": {
        "bytesBase64Encoded": "B64_BASE_IMAGE"
      }
    }
  ],
  "parameters": {
    "sampleCount": EDIT_IMAGE_COUNT,
    "negativePrompt": "NEGATIVE_PROMPT",
    "controlPluginConfig":  {
      "conditions": [
        {
          "conditionName": "CONDITION",
          "controlScale": CONTROL_SCALE,
          "samplingSteps": SAMPLING_STEPS,
          "computeConditionMap": COMPUTE_CONDITION_MAP
        }
      ]
    }
  }
}

如要傳送要求，請選擇以下其中一個選項：

curl

將要求主體儲存在名為 request.json 的檔案中，然後執行下列指令：

curl -X POST \
     -H "Authorization: Bearer $(gcloud auth print-access-token)" \
     -H "Content-Type: application/json; charset=utf-8" \
     -d @request.json \
     "https://us-central1-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/us-central1/publishers/google/models/imagen-2.0-edit-preview-0627:predict"

PowerShell

注意： 下列指令假設您已執行 gcloud init 或 gcloud auth login，透過使用者帳戶登入 gcloud CLI。您可以執行 gcloud auth list 查看目前有效的帳戶。

將要求主體儲存在名為 request.json 的檔案中，然後執行下列指令：

$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }

Invoke-WebRequest `
    -Method POST `
    -Headers $headers `
    -ContentType: "application/json; charset=utf-8" `
    -InFile request.json `
    -Uri "https://us-central1-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/us-central1/publishers/google/models/imagen-2.0-edit-preview-0627:predict" | Select-Object -Expand Content

以下是含有 "sampleCount": 2 的要求範例回應。回應會傳回兩個預測物件，其中包含以 base64 編碼產生的圖片位元組。

{
  "predictions": [
    {
      "bytesBase64Encoded": "BASE64_IMG_BYTES",
      "mimeType": "image/png"
    },
    {
      "mimeType": "image/png",
      "bytesBase64Encoded": "BASE64_IMG_BYTES"
    }
  ]
}

產品使用量累進區間

如要查看與 Vertex AI 上的 Imagen 相關聯的使用標準和內容限制，請參閱使用指南。

模型版本

你可以使用多種圖片生成模型。詳情請參閱「Imagen 模型」。

後續步驟

閱讀有關 Imagen 和其他 Vertex AI 生成式 AI 產品的文章：