Usar la función de reescritura de peticiones

Probar la generación de imágenes (Vertex AI Studio)

Probar Imagen en Colab

Imagen en Vertex AI ofrece una herramienta de reformulación de peticiones basada en LLMs, también conocida como reformulador de peticiones. La herramienta de reescritura de peticiones te ayuda a obtener imágenes de mayor calidad añadiendo más detalles a tu petición.

Si inhabilitas la función de reescritura de peticiones, puede que la calidad de las imágenes y el parecido del resultado con la petición que has proporcionado se vean afectados. Esta función está habilitada de forma predeterminada en las siguientes versiones del modelo:

  • imagen-4.0-generate-001
  • imagen-4.0-fast-generate-001
  • imagen-4.0-ultra-generate-001
  • imagen-3.0-generate-002

La petición reescrita se envía mediante la respuesta de la API solo si la petición original tiene menos de 30 palabras.

Usar la herramienta de reformulación de peticiones

Para usar la función de reescritura de peticiones, sigue estos pasos:

Consola

  1. En la Google Cloud consola, ve a la página Vertex AI > Media Studio.

    Ir a Media Studio

  2. Haz clic en Imagen. Se muestra la página de generación de imágenes de Imagen Media Studio.

  3. En el panel Configuración, ajusta las siguientes opciones:

    • Modelo: elige un modelo de entre las opciones disponibles.

      Para obtener más información sobre los modelos disponibles, consulta Modelos de imagen.

    • Número de resultados: ajusta el control deslizante o introduce un valor entre 1 y 4.

    • En el cuadro Petición negativa, escribe una petición que describa lo que no quieres que se genere en la imagen.

  4. En el cuadro Escribe tu petición, haz clic en Ayúdame a escribir.

    Se muestra la ventana Mejora mi petición.

  5. En el cuadro Petición actual, escribe tu petición y, a continuación, haz clic en Mejorar.

    La petición reformulada se muestra en el cuadro Petición mejorada. Puedes editar la petición mejorada o usarla tal cual.

  6. Haz clic en Insertar para usar la petición que se muestra.

    La petición se inserta en el cuadro Escribe tu petición.

  7. Haz clic en Generar.

REST

Antes de usar los datos de la solicitud, haz las siguientes sustituciones:

  • PROJECT_ID: tu Google Cloud ID de proyecto.
  • MODEL_VERSION: la versión del modelo de generación de imágenes que se va a usar.

    Para obtener más información sobre las versiones y las funciones de los modelos, consulta Versiones de los modelos.

  • LOCATION: la región de tu proyecto. Por ejemplo, us-central1, europe-west2 o asia-northeast3. Para ver una lista de las regiones disponibles, consulta Ubicaciones de la IA generativa en Vertex AI.
  • TEXT_PROMPT: la petición de texto que indica qué imágenes debe generar el modelo. Antes de generar las imágenes, esta petición base se mejora con más detalles y un lenguaje descriptivo mediante la herramienta de reescritura de peticiones basada en LLMs.
  • IMAGE_COUNT: un número entero que describe el número de imágenes que se van a generar. Los valores aceptados son 1-4. El valor predeterminado es 4.
  • PROMPT_SETTING: valor booleano. true habilita las peticiones mejoradas y false las inhabilita. El valor predeterminado es true.

Método HTTP y URL:

POST https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/MODEL_VERSION:predict

Cuerpo JSON de la solicitud:

{
  "instances": [
    {
      "prompt": "TEXT_PROMPT"
    }
  ],
  "parameters": {
    "sampleCount": IMAGE_COUNT,
    "enhancePrompt": PROMPT_SETTING
  }
}

Para enviar tu solicitud, elige una de estas opciones:

curl

Guarda el cuerpo de la solicitud en un archivo llamado request.json y ejecuta el siguiente comando:

curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/MODEL_VERSION:predict"

PowerShell

Guarda el cuerpo de la solicitud en un archivo llamado request.json y ejecuta el siguiente comando:

$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }

Invoke-WebRequest `
-Method POST `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/MODEL_VERSION:predict" | Select-Object -Expand Content
Si la mejora de la petición está habilitada, la respuesta incluye un campo prompt adicional que muestra la petición mejorada y la imagen generada asociada:
  {
    "predictions": [
      {
        "mimeType": "MIME_TYPE",
        "prompt": "ENHANCED_PROMPT_1",
        "bytesBase64Encoded": "BASE64_IMG_BYTES_1"
      },
      {
        "mimeType": "MIME_TYPE",
        "prompt": "ENHANCED_PROMPT_2",
        "bytesBase64Encoded": "BASE64_IMG_BYTES_2"
      }
    ]
  }

Por ejemplo, la siguiente respuesta de ejemplo corresponde a una solicitud con "sampleCount": 2 y "prompt": "A raccoon wearing formal clothes, wearing a top hat. Oil painting in the style of Vincent Van Gogh.". La respuesta devuelve dos objetos de predicción, cada uno con su petición mejorada y los bytes de la imagen generada codificados en base64.

{
  "predictions": [
    {
      "mimeType": "image/png",
      "prompt": "An oil painting in the style of Vincent van Gogh,
        depicting a raccoon adorned in a finely tailored tuxedo, complete with a
        crisp white shirt and a bow tie. The raccoon also sports a classic top
        hat, perched jauntily on its head. The painting uses thick, swirling
        brushstrokes characteristic of van Gogh, with vibrant hues of blue,
        yellow, and green in the background, contrasting with the dark tones of
        the raccoon's attire. The light source is subtly placed, casting a
        dramatic shadow of the raccoon's attire onto the surface it sits upon,
        further enhancing the depth and dimensionality of the composition. The
        overall impression is one of a whimsical and sophisticated character, a
        raccoon elevated to a higher class through its formal attire, rendered
        in van Gogh's iconic style.",
      "bytesBase64Encoded": "BASE64_IMG_BYTES"
    },
    {
      "mimeType": "image/png",
      "prompt": "An oil painting in the style of Vincent van Gogh featuring
        a raccoon in a dapper suit, complete with a black jacket, crisp white
        shirt, and a black bow tie. The raccoon is wearing a black top hat,
        adding a touch of elegance to its ensemble. The painting is rendered
        with characteristic van Gogh brushwork, utilizing thick, impasto strokes
        of color. The background is a swirl of blues, greens, and yellows,
        creating a vibrant yet slightly chaotic atmosphere that contrasts with
        the raccoon's formal attire. The lighting is dramatic, casting sharp
        shadows and highlighting the textures of the fabric and the raccoon's
        fur, enhancing the sense of realism within the fantastical scene. The
        composition focuses on the raccoon's proud posture, highlighting the
        whimsical contrast of a wild animal dressed in formal attire, captured
        in the unique artistic language of van Gogh. ",
      "bytesBase64Encoded": "BASE64_IMG_BYTES"
    }
  ]
}

Siguientes pasos