Esta página se ha traducido con Cloud Translation API.

Personalización de instrucciones

Atención: A partir del 24 de junio del 2025, las versiones 1 y 2 de Imagen estarán obsoletas. Los modelos de Imagen imagegeneration@002, imagegeneration@005 y imagegeneration@006 se retirarán el 24 de septiembre del 2025 . Para obtener más información sobre cómo migrar a Imagen 3, consulta el artículo Migrar a Imagen 3.

Puedes usar Imagen en Vertex AI para indicar al modelo cómo personalizar y transformar los elementos de una imagen con el estilo que especifiques en una petición de texto.

Ver la tarjeta de modelo de Imagen para edición y personalización

Redacción de peticiones de personalización

La petición que uses con la personalización de Imagen 3 puede afectar a la calidad de las imágenes generadas. Usa las siguientes plantillas de peticiones como punto de partida para escribir peticiones de personalización. Es posible que tengas que enviar varias solicitudes para obtener el resultado que buscas.

Caso práctico	Imágenes de referencia	Plantilla de petición	Ejemplo
Personalización con instrucciones: transferencia de estilo	Imagen (1)	Transforma el `subject in image [1]` para que tenga el estilo ${STYLE_DESCRIPTION}. La imagen muestra ${IMAGE_DESCRIPTION}.	Transforma la `subject in image [1]` para que tenga el estilo de una acuarela de la imagen con técnicas de acuarela sueltas, un tono suave, colores pastel, pinceladas, un fondo delicado y limpio, espontaneidad, un dibujo de estilo analógico y una pintura intrincada y muy detallada. La imagen muestra un retrato de una mujer orgullosa.

Personalizar con la personalización mediante instrucciones para la transferencia de estilo

Usa los siguientes ejemplos de código para especificar el estilo de las imágenes de salida en función del estilo descrito en la petición de texto.

REST

Antes de usar los datos de la solicitud, haz las siguientes sustituciones:

PROJECT_ID: tu Google Cloud ID de proyecto.
LOCATION: la región de tu proyecto. Por ejemplo, us-central1, europe-west2 o asia-northeast3. Para ver una lista de las regiones disponibles, consulta Ubicaciones de la IA generativa en Vertex AI.
TEXT_PROMPT: La petición de texto indica qué imágenes genera el modelo. Para usar la personalización de Imagen 3, incluye el referenceId de la imagen o las imágenes de referencia que proporciones en el formato [$referenceId]. Por ejemplo:
- Transforma el sujeto de la imagen [1] para que tenga un estilo de vidriera digital.
- Añade un sombrero de vaquero rojo al gato de la imagen [1].
- Quita el perro corgi de la imagen [1].
- Cambia la pelota roja de la imagen [1] por un cuadrado azul.
"referenceId": ID de la imagen de referencia o de una serie de imágenes de referencia que corresponden al mismo tema o estilo.
BASE64_REFERENCE_IMAGE: una imagen de referencia para guiar la generación de imágenes. La imagen debe especificarse como una cadena de bytes codificada en Base64.
IMAGE_COUNT: número de imágenes generadas. Valores enteros aceptados: del 1 al 4. Valor predeterminado: 4.

Método HTTP y URL:

POST https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/imagen-3.0-capability-001:predict

Cuerpo JSON de la solicitud:

{
  "instances": [
    {
      "prompt": "TEXT_PROMPT",
      "referenceImages": [
        {
          "referenceType": "REFERENCE_TYPE_RAW",
          "referenceId": 1,
          "referenceImage": {
            "bytesBase64Encoded": "BASE64_REFERENCE_IMAGE"
          }
        }
      ]
    }
  ],
  "parameters": {
    "sampleCount": IMAGE_COUNT
  }
}

Para enviar tu solicitud, elige una de estas opciones:

curl

Nota: En el siguiente comando se presupone que has iniciado sesión en la CLI de gcloud con tu cuenta de usuario ejecutando gcloud init o gcloud auth login , o bien usando Cloud Shell, que inicia sesión automáticamente en la CLI de gcloud . Para comprobar la cuenta activa, ejecuta el comando gcloud auth list.

Guarda el cuerpo de la solicitud en un archivo llamado request.json y ejecuta el siguiente comando:

curl -X POST \
     -H "Authorization: Bearer $(gcloud auth print-access-token)" \
     -H "Content-Type: application/json; charset=utf-8" \
     -d @request.json \
     "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/imagen-3.0-capability-001:predict"

PowerShell

Nota: El siguiente comando presupone que has iniciado sesión en la CLI de gcloud con tu cuenta de usuario ejecutando gcloud init o gcloud auth login . Para comprobar la cuenta activa, ejecuta el comando gcloud auth list.

Guarda el cuerpo de la solicitud en un archivo llamado request.json y ejecuta el siguiente comando:

$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }

Invoke-WebRequest `
    -Method POST `
    -Headers $headers `
    -ContentType: "application/json; charset=utf-8" `
    -InFile request.json `
    -Uri "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/imagen-3.0-capability-001:predict" | Select-Object -Expand Content

La siguiente respuesta de ejemplo corresponde a una solicitud con "sampleCount": 2. La respuesta devuelve dos objetos de predicción con los bytes de la imagen generada codificados en Base64.

{
  "predictions": [
    {
      "bytesBase64Encoded": "BASE64_IMG_BYTES",
      "mimeType": "image/png"
    },
    {
      "mimeType": "image/png",
      "bytesBase64Encoded": "BASE64_IMG_BYTES"
    }
  ]
}

Uso del producto

Para ver los estándares de uso y las restricciones de contenido asociados a Imagen en Vertex AI, consulta las directrices de uso.

Versiones del modelo

Puedes usar varios modelos de generación de imágenes. Para obtener más información, consulta Modelos de imagen.

Siguientes pasos

Consulta artículos sobre Imagen y otros productos de IA generativa en Vertex AI: