Cómo establecer la resolución de salida

Imagen en Vertex AI te permite establecer la resolución de salida de las imágenes generadas cuando usas los siguientes modelos de Imagen 4:

  • imagen-4.0-generate-001
  • imagen-4.0-ultra-generate-001

Console

  1. En la Google Cloud consola, ve a la página Vertex AI > Media Studio.

    Ir a Media Studio

  2. Haz clic en Imagen. Se mostrará la página de generación de imágenes de Imagen Media Studio.

  3. En el panel Configuración, ajusta las siguientes opciones:

    • Modelo: Elige un modelo entre las opciones disponibles.

      Para obtener más información sobre los modelos disponibles, consulta Modelos de Imagen.

    • Resolución de salida: Elige una resolución de salida entre las opciones disponibles.

  4. En el cuadro Escribe tu instrucción, ingresa la instrucción de texto que describe las imágenes que se generarán. Por ejemplo, "small boat on water in the morning watercolor illustration"

  5. Haz clic en Generar .

REST

Antes de usar cualquiera de los datos de solicitud a continuación, realiza los siguientes reemplazos:

  • REGION: Es la región en la que se encuentra tu proyecto. Para obtener más información sobre las regiones admitidas, consulta IA generativa en ubicaciones de Vertex AI.
  • TEXT_PROMPT: Es la instrucción de texto que se usará para generar imágenes.
  • PROJECT_ID: El ID de tu proyecto de Google Cloud .
  • MODEL_VERSION: Es la versión del modelo Imagen que se usará. Los siguientes son los valores aceptados cuando se usa sampleImageSize:
    • imagen-4.0-generate-001
    • imagen-4.0-ultra-generate-001
  • IMAGE_RESOLUTION: Es la resolución de la imagen de salida. Se aceptan los siguientes documentos:
    • "1K"
    • "2K"

    El parámetro de configuración predeterminado es "1K".

  • IMAGE_COUNT: Es la cantidad de imágenes que se generarán. El rango de valores aceptado es de 1 a 4.

Método HTTP y URL:

POST https://REGION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/REGION/publishers/google/models/MODEL_VERSION:predict

Cuerpo JSON de la solicitud:

{
  "instances": [
    {
      "prompt": "TEXT_PROMPT"
    }
  ],
  "parameters": {
    "sampleImageSize": "IMAGE_RESOLUTION",
    "sampleCount": IMAGE_COUNT
  }
}

Para enviar tu solicitud, elige una de estas opciones:

curl

Guarda el cuerpo de la solicitud en un archivo llamado request.json y ejecuta el siguiente comando:

curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://REGION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/REGION/publishers/google/models/MODEL_VERSION:predict"

PowerShell

Guarda el cuerpo de la solicitud en un archivo llamado request.json y ejecuta el siguiente comando:

$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }

Invoke-WebRequest `
-Method POST `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://REGION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/REGION/publishers/google/models/MODEL_VERSION:predict" | Select-Object -Expand Content
La solicitud devuelve objetos de imagen. En este ejemplo, se devuelven dos objetos de imagen, con dos objetos de predicción como imágenes codificadas en base64.
{
  "predictions": [
    {
      "mimeType": "image/png",
      "bytesBase64Encoded": "BASE64_IMG_BYTES"
    },
    {
      "bytesBase64Encoded": "BASE64_IMG_BYTES",
      "mimeType": "image/png"
    }
  ]
}