Probar la generación de imágenes (Vertex AI Studio)
Imagen en Vertex AI ofrece una herramienta de reformulación de peticiones basada en LLMs, también conocida como reformulador de peticiones. La herramienta de reescritura de peticiones te ayuda a obtener imágenes de mayor calidad añadiendo más detalles a tu petición.
Si inhabilitas la función de reescritura de peticiones, puede que la calidad de las imágenes y el parecido del resultado con la petición que has proporcionado se vean afectados. Esta función está habilitada de forma predeterminada en las siguientes versiones del modelo:
imagen-4.0-generate-001
imagen-4.0-fast-generate-001
imagen-4.0-ultra-generate-001
imagen-3.0-generate-002
La petición reescrita se envía mediante la respuesta de la API solo si la petición original tiene menos de 30 palabras.
Usar la herramienta de reformulación de peticiones
Para usar la función de reescritura de peticiones, sigue estos pasos:
Consola
En la Google Cloud consola, ve a la página Vertex AI > Media Studio.
Haz clic en Imagen. Se muestra la página de generación de imágenes de Imagen Media Studio.
En el panel Configuración, ajusta las siguientes opciones:
Modelo: elige un modelo de entre las opciones disponibles.
Para obtener más información sobre los modelos disponibles, consulta Modelos de imagen.
Número de resultados: ajusta el control deslizante o introduce un valor entre 1 y 4.
En el cuadro Petición negativa, escribe una petición que describa lo que no quieres que se genere en la imagen.
En el cuadro Escribe tu petición, haz clic en Ayúdame a escribir.
Se muestra la ventana Mejora mi petición.
En el cuadro Petición actual, escribe tu petición y, a continuación, haz clic en Mejorar.
La petición reformulada se muestra en el cuadro Petición mejorada. Puedes editar la petición mejorada o usarla tal cual.
Haz clic en Insertar para usar la petición que se muestra.
La petición se inserta en el cuadro Escribe tu petición.
Haz clic en
Generar.
REST
Antes de usar los datos de la solicitud, haz las siguientes sustituciones:
- PROJECT_ID: tu Google Cloud ID de proyecto.
- MODEL_VERSION: la versión del modelo de generación de imágenes que se va a usar.
Para obtener más información sobre las versiones y las funciones de los modelos, consulta Versiones de los modelos.
- LOCATION: la región de tu proyecto. Por ejemplo,
us-central1
,europe-west2
oasia-northeast3
. Para ver una lista de las regiones disponibles, consulta Ubicaciones de la IA generativa en Vertex AI. - TEXT_PROMPT: la petición de texto que indica qué imágenes debe generar el modelo. Antes de generar las imágenes, esta petición base se mejora con más detalles y un lenguaje descriptivo mediante la herramienta de reescritura de peticiones basada en LLMs.
-
IMAGE_COUNT: un número entero que describe el número de imágenes que se van a generar. Los valores aceptados son
1
-4
. El valor predeterminado es4
. -
PROMPT_SETTING: valor booleano.
true
habilita las peticiones mejoradas yfalse
las inhabilita. El valor predeterminado estrue
.
Método HTTP y URL:
POST https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/MODEL_VERSION:predict
Cuerpo JSON de la solicitud:
{ "instances": [ { "prompt": "TEXT_PROMPT" } ], "parameters": { "sampleCount": IMAGE_COUNT, "enhancePrompt": PROMPT_SETTING } }
Para enviar tu solicitud, elige una de estas opciones:
curl
Guarda el cuerpo de la solicitud en un archivo llamado request.json
y ejecuta el siguiente comando:
curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/MODEL_VERSION:predict"
PowerShell
Guarda el cuerpo de la solicitud en un archivo llamado request.json
y ejecuta el siguiente comando:
$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }
Invoke-WebRequest `
-Method POST `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/MODEL_VERSION:predict" | Select-Object -Expand Content
prompt
adicional que muestra la petición mejorada y la imagen generada asociada:
{ "predictions": [ { "mimeType": "MIME_TYPE", "prompt": "ENHANCED_PROMPT_1", "bytesBase64Encoded": "BASE64_IMG_BYTES_1" }, { "mimeType": "MIME_TYPE", "prompt": "ENHANCED_PROMPT_2", "bytesBase64Encoded": "BASE64_IMG_BYTES_2" } ] }
Por ejemplo, la siguiente respuesta de ejemplo corresponde a una solicitud con "sampleCount": 2
y "prompt": "A raccoon wearing formal
clothes, wearing a top hat. Oil painting in the style of Vincent Van
Gogh."
. La respuesta devuelve dos objetos de predicción, cada uno con su petición mejorada y los bytes de la imagen generada codificados en base64.
{ "predictions": [ { "mimeType": "image/png", "prompt": "An oil painting in the style of Vincent van Gogh, depicting a raccoon adorned in a finely tailored tuxedo, complete with a crisp white shirt and a bow tie. The raccoon also sports a classic top hat, perched jauntily on its head. The painting uses thick, swirling brushstrokes characteristic of van Gogh, with vibrant hues of blue, yellow, and green in the background, contrasting with the dark tones of the raccoon's attire. The light source is subtly placed, casting a dramatic shadow of the raccoon's attire onto the surface it sits upon, further enhancing the depth and dimensionality of the composition. The overall impression is one of a whimsical and sophisticated character, a raccoon elevated to a higher class through its formal attire, rendered in van Gogh's iconic style.", "bytesBase64Encoded": "BASE64_IMG_BYTES" }, { "mimeType": "image/png", "prompt": "An oil painting in the style of Vincent van Gogh featuring a raccoon in a dapper suit, complete with a black jacket, crisp white shirt, and a black bow tie. The raccoon is wearing a black top hat, adding a touch of elegance to its ensemble. The painting is rendered with characteristic van Gogh brushwork, utilizing thick, impasto strokes of color. The background is a swirl of blues, greens, and yellows, creating a vibrant yet slightly chaotic atmosphere that contrasts with the raccoon's formal attire. The lighting is dramatic, casting sharp shadows and highlighting the textures of the fabric and the raccoon's fur, enhancing the sense of realism within the fantastical scene. The composition focuses on the raccoon's proud posture, highlighting the whimsical contrast of a wild animal dressed in formal attire, captured in the unique artistic language of van Gogh. ", "bytesBase64Encoded": "BASE64_IMG_BYTES" } ] }
Siguientes pasos
- Definir el idioma de la petición de texto
- Configurar la relación de aspecto
- Omitir contenido con una petición negativa
- Generar imágenes deterministas