设置输出分辨率

使用 Vertex AI 上的 Imagen,您可以在使用以下 Imagen 4 模型时设置生成的图片的输出分辨率:

  • imagen-4.0-generate-001
  • imagen-4.0-ultra-generate-001

控制台

  1. 在 Google Cloud 控制台中,依次前往 Vertex AI > Media Studio 页面。

    前往 Media Studio

  2. 点击 Imagen。系统会显示 Imagen Media Studio 图片生成页面。

  3. 设置面板中,调整以下选项:

    • 模型:从可用选项中选择一个模型。

      如需详细了解可用的模型,请参阅 Imagen 模型

    • 输出分辨率:从可用选项中选择一个输出分辨率。

  4. 撰写提示框中,输入描述要生成的图片的文本提示。例如 "small boat on water in the morning watercolor illustration"

  5. 点击 生成

REST

在使用任何请求数据之前,请先进行以下替换:

  • REGION:项目所在的区域。如需详细了解支持的区域,请参阅 Vertex AI 上的生成式 AI 位置
  • TEXT_PROMPT:用于生成图片的文本提示。
  • PROJECT_ID:您的 Google Cloud 项目 ID。
  • MODEL_VERSION: 要使用的 Imagen 模型版本。使用 sampleImageSize 时,系统接受以下值:
    • imagen-4.0-generate-001
    • imagen-4.0-ultra-generate-001
  • IMAGE_RESOLUTION:输出图片分辨率。我们接受以下内容:
    • "1K"
    • "2K"

    默认设置为 "1K"

  • IMAGE_COUNT:要生成的图片数量。接受的值范围为 14

HTTP 方法和网址:

POST https://REGION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/REGION/publishers/google/models/MODEL_VERSION:predict

请求 JSON 正文:

{
  "instances": [
    {
      "prompt": "TEXT_PROMPT"
    }
  ],
  "parameters": {
    "sampleImageSize": "IMAGE_RESOLUTION",
    "sampleCount": IMAGE_COUNT
  }
}

如需发送请求,请选择以下方式之一:

curl

将请求正文保存在名为 request.json 的文件中,然后执行以下命令:

curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://REGION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/REGION/publishers/google/models/MODEL_VERSION:predict"

PowerShell

将请求正文保存在名为 request.json 的文件中,然后执行以下命令:

$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }

Invoke-WebRequest `
-Method POST `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://REGION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/REGION/publishers/google/models/MODEL_VERSION:predict" | Select-Object -Expand Content
请求返回图片对象。在此示例中,系统会返回两个图片对象,其中包含两个预测对象(以 base64 编码的图片形式)。
{
  "predictions": [
    {
      "mimeType": "image/png",
      "bytesBase64Encoded": "BASE64_IMG_BYTES"
    },
    {
      "bytesBase64Encoded": "BASE64_IMG_BYTES",
      "mimeType": "image/png"
    }
  ]
}