Esta página se ha traducido con Cloud Translation API.

Definir la resolución de salida

Imagen en Vertex AI te permite definir la resolución de salida de las imágenes generadas cuando usas los siguientes modelos de Imagen 4:

imagen-4.0-generate-001
imagen-4.0-ultra-generate-001

Consola

En la Google Cloud consola, ve a la página Vertex AI > Media Studio.

Ir a Media Studio
Haz clic en Imagen. Se muestra la página de generación de imágenes de Imagen Media Studio.
En el panel Configuración, ajusta las siguientes opciones:
- Modelo: elige un modelo de entre las opciones disponibles.
  
  Para obtener más información sobre los modelos disponibles, consulta Modelos de Imagen.
- Resolución de salida: elige una resolución de salida de entre las opciones disponibles.
En el cuadro Escribe tu petición, introduce la petición de texto que describa las imágenes que quieres generar. Por ejemplo, "small boat on water in the morning watercolor illustration".
Haz clic en Generar.

REST

Antes de usar los datos de la solicitud, haz las siguientes sustituciones:

REGION: la región en la que se encuentra tu proyecto. Para obtener más información sobre las regiones admitidas, consulta Ubicaciones de la IA generativa en Vertex AI.
TEXT_PROMPT: la petición de texto que se usará para generar imágenes.
PROJECT_ID: tu ID de proyecto. Google Cloud
MODEL_VERSION: Versión del modelo de Imagen que se va a usar. Estos son los valores aceptados al usar sampleImageSize:
- imagen-4.0-generate-001
- imagen-4.0-ultra-generate-001
IMAGE_RESOLUTION: resolución de la imagen de salida. Se aceptan los siguientes documentos:
- "1K"
- "2K"
El valor predeterminado es "1K".
IMAGE_COUNT: el número de imágenes que se van a generar. El intervalo de valores aceptado es de 1 a 4.

Método HTTP y URL:

POST https://REGION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/REGION/publishers/google/models/MODEL_VERSION:predict

Cuerpo JSON de la solicitud:

{
  "instances": [
    {
      "prompt": "TEXT_PROMPT"
    }
  ],
  "parameters": {
    "sampleImageSize": "IMAGE_RESOLUTION",
    "sampleCount": IMAGE_COUNT
  }
}

Para enviar tu solicitud, elige una de estas opciones:

curl

Nota: En el siguiente comando se presupone que has iniciado sesión en la CLI de gcloud con tu cuenta de usuario ejecutando gcloud init o gcloud auth login , o bien usando Cloud Shell, que inicia sesión automáticamente en la CLI de gcloud . Para comprobar la cuenta activa, ejecuta el comando gcloud auth list.

Guarda el cuerpo de la solicitud en un archivo llamado request.json y ejecuta el siguiente comando:

curl -X POST \
     -H "Authorization: Bearer $(gcloud auth print-access-token)" \
     -H "Content-Type: application/json; charset=utf-8" \
     -d @request.json \
     "https://REGION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/REGION/publishers/google/models/MODEL_VERSION:predict"

PowerShell

Nota: El siguiente comando presupone que has iniciado sesión en la CLI de gcloud con tu cuenta de usuario ejecutando gcloud init o gcloud auth login . Para comprobar la cuenta activa, ejecuta el comando gcloud auth list.

Guarda el cuerpo de la solicitud en un archivo llamado request.json y ejecuta el siguiente comando:

$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }

Invoke-WebRequest `
    -Method POST `
    -Headers $headers `
    -ContentType: "application/json; charset=utf-8" `
    -InFile request.json `
    -Uri "https://REGION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/REGION/publishers/google/models/MODEL_VERSION:predict" | Select-Object -Expand Content

La solicitud devuelve objetos de imagen. En este ejemplo, se devuelven dos objetos de imagen, con dos objetos de predicción como imágenes codificadas en Base64.

{
  "predictions": [
    {
      "mimeType": "image/png",
      "bytesBase64Encoded": "BASE64_IMG_BYTES"
    },
    {
      "bytesBase64Encoded": "BASE64_IMG_BYTES",
      "mimeType": "image/png"
    }
  ]
}