Definir resolução de saída

Com o Imagen na Vertex AI, é possível definir a resolução de saída das imagens geradas ao usar os seguintes modelos do Imagen 4:

  • imagen-4.0-generate-001
  • imagen-4.0-ultra-generate-001

Console

  1. No console do Google Cloud , acesse a página Vertex AI > Media Studio.

    Acessar o Media Studio

  2. Clique em Imagen. A página de geração de imagens do Imagen Media Studio é exibida.

  3. No painel Configurações, ajuste as seguintes opções:

    • Modelo: escolha um modelo entre as opções disponíveis.

      Para mais informações sobre os modelos disponíveis, consulte Modelos do Imagen.

    • Resolução de saída: escolha uma resolução de saída entre as opções disponíveis.

  4. Na caixa Escreva seu comando, insira o comando de texto que descreve as imagens a serem geradas. Por exemplo, "small boat on water in the morning watercolor illustration".

  5. Clique em Gerar.

REST

Antes de usar os dados da solicitação abaixo, faça as substituições a seguir:

  • REGION: a região em que o projeto está localizado. Para mais informações sobre as regiões com suporte, consulte Locais da IA generativa na Vertex AI.
  • TEXT_PROMPT: o prompt de texto a ser usado para gerar imagens.
  • PROJECT_ID: o ID do projeto do Google Cloud .
  • MODEL_VERSION: A versão do modelo do Imagen a ser usada. Os seguintes valores são aceitos ao usar sampleImageSize:
    • imagen-4.0-generate-001
    • imagen-4.0-ultra-generate-001
  • IMAGE_RESOLUTION: a resolução da imagem de saída. Os seguintes itens são aceitos:
    • "1K"
    • "2K"

    A configuração padrão é "1K".

  • IMAGE_COUNT: o número de imagens a serem geradas. O intervalo de valores aceito é de 1 a 4.

Método HTTP e URL:

POST https://REGION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/REGION/publishers/google/models/MODEL_VERSION:predict

Corpo JSON da solicitação:

{
  "instances": [
    {
      "prompt": "TEXT_PROMPT"
    }
  ],
  "parameters": {
    "sampleImageSize": "IMAGE_RESOLUTION",
    "sampleCount": IMAGE_COUNT
  }
}

Para enviar a solicitação, escolha uma destas opções:

curl

Salve o corpo da solicitação em um arquivo com o nome request.json e execute o comando a seguir:

curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://REGION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/REGION/publishers/google/models/MODEL_VERSION:predict"

PowerShell

Salve o corpo da solicitação em um arquivo com o nome request.json e execute o comando a seguir:

$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }

Invoke-WebRequest `
-Method POST `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://REGION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/REGION/publishers/google/models/MODEL_VERSION:predict" | Select-Object -Expand Content
A solicitação retorna objetos de imagem. Neste exemplo, dois objetos de imagem são retornados, com dois objetos de previsão como imagens codificadas em base64.
{
  "predictions": [
    {
      "mimeType": "image/png",
      "bytesBase64Encoded": "BASE64_IMG_BYTES"
    },
    {
      "bytesBase64Encoded": "BASE64_IMG_BYTES",
      "mimeType": "image/png"
    }
  ]
}