Defina a resolução de saída

O Imagen na Vertex AI permite-lhe definir a resolução de saída das imagens geradas quando usa os seguintes modelos do Imagen 4:

  • imagen-4.0-generate-001
  • imagen-4.0-ultra-generate-001

Consola

  1. Na Google Cloud consola, aceda à página Vertex AI > Media Studio.

    Aceda ao Media Studio

  2. Clique em Imagen. A página de geração de imagens do Imagen Media Studio é apresentada.

  3. No painel Definições, ajuste as seguintes opções:

    • Modelo: escolha um modelo entre as opções disponíveis.

      Para mais informações sobre os modelos disponíveis, consulte os modelos do Imagen.

    • Resolução de saída: escolha uma resolução de saída entre as opções disponíveis.

  4. Na caixa Escreva o seu comando, introduza o comando de texto que descreve as imagens a gerar. Por exemplo, "small boat on water in the morning watercolor illustration".

  5. Clique em Gerar.

REST

Antes de usar qualquer um dos dados do pedido, faça as seguintes substituições:

  • REGION: a região onde o seu projeto está localizado. Para mais informações sobre as regiões suportadas, consulte o artigo IA generativa nas localizações do Vertex AI.
  • TEXT_PROMPT: o comando de texto a usar para gerar imagens.
  • PROJECT_ID: o seu ID do projeto Google Cloud .
  • MODEL_VERSION: A versão do modelo Imagen a usar. Seguem-se os valores aceites quando usa sampleImageSize:
    • imagen-4.0-generate-001
    • imagen-4.0-ultra-generate-001
  • IMAGE_RESOLUTION: a resolução da imagem de saída. São aceites:
    • "1K"
    • "2K"

    A predefinição é "1K".

  • IMAGE_COUNT: o número de imagens a gerar. O intervalo de valores aceite é de 1 a 4.

Método HTTP e URL:

POST https://REGION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/REGION/publishers/google/models/MODEL_VERSION:predict

Corpo JSON do pedido:

{
  "instances": [
    {
      "prompt": "TEXT_PROMPT"
    }
  ],
  "parameters": {
    "sampleImageSize": "IMAGE_RESOLUTION",
    "sampleCount": IMAGE_COUNT
  }
}

Para enviar o seu pedido, escolha uma destas opções:

curl

Guarde o corpo do pedido num ficheiro com o nome request.json, e execute o seguinte comando:

curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://REGION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/REGION/publishers/google/models/MODEL_VERSION:predict"

PowerShell

Guarde o corpo do pedido num ficheiro com o nome request.json, e execute o seguinte comando:

$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }

Invoke-WebRequest `
-Method POST `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://REGION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/REGION/publishers/google/models/MODEL_VERSION:predict" | Select-Object -Expand Content
O pedido devolve objetos de imagem. Neste exemplo, são devolvidos dois objetos de imagem, com dois objetos de previsão como imagens codificadas em base64.
{
  "predictions": [
    {
      "mimeType": "image/png",
      "bytesBase64Encoded": "BASE64_IMG_BYTES"
    },
    {
      "bytesBase64Encoded": "BASE64_IMG_BYTES",
      "mimeType": "image/png"
    }
  ]
}