Esta página se ha traducido con Cloud Translation API.

Editar imágenes con Gemini

Precaución: Los modelos gemini-2.0-flash-preview-image-generation y gemini-2.5-flash-image-preview dejarán de estar disponibles el 31 de octubre del 2025. Migra los flujos de trabajo a gemini-2.5-flash-image antes de esa fecha para evitar interrupciones en el servicio.

Gemini 2.5 Flash Image admite varios tipos de edición de imágenes.

Edición de imágenes

Gemini 2.5 Flash Image para la generación de imágenes (gemini-2.5-flash-image) permite editar imágenes además de generarlas. Gemini 2.5 Flash Image admite una edición de imágenes y una edición de varias rondas mejoradas, y contiene filtros de seguridad actualizados que ofrecen una experiencia de usuario más flexible y menos restrictiva.

Admite las siguientes modalidades y funciones:

Edición de imágenes (texto e imagen a imagen)
- Petición de ejemplo: "Edita esta imagen para que parezca un dibujo animado"
- Petición de ejemplo: [imagen de un gato] + [imagen de una almohada] + "Crea un bordado de punto de cruz de mi gato en esta almohada".
Edición de imágenes multiturno (chat)
- Ejemplos de peticiones: [sube una imagen de un coche azul]. "Convierte este coche en un descapotable". "Ahora, cambia el color a amarillo". "Añade un spoiler".

Editar una imagen

Consola

Para editar imágenes, sigue estos pasos:

Abre Vertex AI Studio > Crear petición.
Haz clic en Cambiar modelo y selecciona gemini-2.5-flash-image en el menú.
En el panel Resultados, selecciona Imagen y texto en el menú desplegable.
Haz clic en Insertar contenido multimedia () y selecciona una fuente en el menú. A continuación, sigue las instrucciones del cuadro de diálogo.
Escribe los cambios que quieras hacer en la imagen en el área de texto Escribe una petición.
Haz clic en el botón Petición ().

Gemini generará una versión editada de la imagen proporcionada basándose en tu descripción. Este proceso debería tardar unos segundos, pero puede ser comparativamente más lento en función de la capacidad.

Python

Instalar

pip install --upgrade google-genai

Para obtener más información, consulta la documentación de referencia del SDK.

Define variables de entorno para usar el SDK de IA generativa con Vertex AI:

# Replace the `GOOGLE_CLOUD_PROJECT` and `GOOGLE_CLOUD_LOCATION` values
# with appropriate values for your project.
export GOOGLE_CLOUD_PROJECT=GOOGLE_CLOUD_PROJECT
export GOOGLE_CLOUD_LOCATION=global
export GOOGLE_GENAI_USE_VERTEXAI=True

from google import genai
from google.genai.types import GenerateContentConfig, Modality
from PIL import Image
from io import BytesIO

client = genai.Client()

# Using an image of Eiffel tower, with fireworks in the background.
image = Image.open("test_resources/example-image-eiffel-tower.png")

response = client.models.generate_content(
    model="gemini-2.5-flash-image",
    contents=[image, "Edit this image to make it look like a cartoon."],
    config=GenerateContentConfig(response_modalities=[Modality.TEXT, Modality.IMAGE]),
)
for part in response.candidates[0].content.parts:
    if part.text:
        print(part.text)
    elif part.inline_data:
        image = Image.open(BytesIO((part.inline_data.data)))
        image.save("output_folder/bw-example-image.png")
# Example response:
#  Here's the cartoon-style edit of the image:
#  Cartoon-style edit:
#  - Simplified the Eiffel Tower with bolder lines and slightly exaggerated proportions.
#  - Brightened and saturated the colors of the sky, fireworks, and foliage for a more vibrant, cartoonish look.
#  ....

Java

Consulta cómo instalar o actualizar Java.

Para obtener más información, consulta la documentación de referencia del SDK.

Define variables de entorno para usar el SDK de IA generativa con Vertex AI:

# Replace the `GOOGLE_CLOUD_PROJECT` and `GOOGLE_CLOUD_LOCATION` values
# with appropriate values for your project.
export GOOGLE_CLOUD_PROJECT=GOOGLE_CLOUD_PROJECT
export GOOGLE_CLOUD_LOCATION=global
export GOOGLE_GENAI_USE_VERTEXAI=True


import com.google.genai.Client;
import com.google.genai.types.Blob;
import com.google.genai.types.Candidate;
import com.google.genai.types.Content;
import com.google.genai.types.GenerateContentConfig;
import com.google.genai.types.GenerateContentResponse;
import com.google.genai.types.Part;
import java.awt.image.BufferedImage;
import java.io.ByteArrayInputStream;
import java.io.File;
import java.io.IOException;
import java.nio.file.Files;
import java.nio.file.Paths;
import java.util.ArrayList;
import java.util.List;
import javax.imageio.ImageIO;

public class ImageGenMmFlashEditImageWithTextAndImage {

  public static void main(String[] args) throws IOException {
    // TODO(developer): Replace these variables before running the sample.
    String modelId = "gemini-2.5-flash-image";
    String outputFile = "resources/output/bw-example-image.png";
    generateContent(modelId, outputFile);
  }

  // Edits an image with image and text input
  public static void generateContent(String modelId, String outputFile) throws IOException {
    // Client Initialization. Once created, it can be reused for multiple requests.
    try (Client client = Client.builder().location("global").vertexAI(true).build()) {

      byte[] localImageBytes =
          Files.readAllBytes(Paths.get("resources/example-image-eiffel-tower.png"));

      GenerateContentResponse response =
          client.models.generateContent(
              modelId,
              Content.fromParts(
                  Part.fromBytes(localImageBytes, "image/png"),
                  Part.fromText("Edit this image to make it look like a cartoon.")),
              GenerateContentConfig.builder().responseModalities("TEXT", "IMAGE").build());

      // Get parts of the response
      List<Part> parts =
          response
              .candidates()
              .flatMap(candidates -> candidates.stream().findFirst())
              .flatMap(Candidate::content)
              .flatMap(Content::parts)
              .orElse(new ArrayList<>());

      // For each part print text if present, otherwise read image data if present and
      // write it to the output file
      for (Part part : parts) {
        if (part.text().isPresent()) {
          System.out.println(part.text().get());
        } else if (part.inlineData().flatMap(Blob::data).isPresent()) {
          BufferedImage image =
              ImageIO.read(new ByteArrayInputStream(part.inlineData().flatMap(Blob::data).get()));
          ImageIO.write(image, "png", new File(outputFile));
        }
      }

      System.out.println("Content written to: " + outputFile);

      // Example response:
      // No problem! Here's the image in a cartoon style...
      //
      // Content written to: resources/output/bw-example-image.png
    }
  }
}

REST

Ejecuta el siguiente comando en el terminal para crear o sobrescribir este archivo en el directorio actual:

curl -X POST \
  -H "Authorization: Bearer $(gcloud auth print-access-token)" \
  -H "Content-Type: application/json" \
  https://${API_ENDPOINT}:generateContent \
  -d '{
    "contents": {
      "role": "USER",
      "parts": [
        {"file_data": {
          "mime_type": "image/jpg",
          "file_uri": "<var>FILE_NAME</var>"
          }
        },
        {"text": "Convert this photo to black and white, in a cartoonish style."},
      ]

    },
    "generation_config": {
      "response_modalities": ["TEXT", "IMAGE"],
      "image_config": {
        "aspect_ratio": "16:9",
      },
    },
    "safetySettings": {
      "method": "PROBABILITY",
      "category": "HARM_CATEGORY_DANGEROUS_CONTENT",
      "threshold": "BLOCK_MEDIUM_AND_ABOVE"
    },
  }' 2>/dev/null >response.json

Nota: Gemini 2.5 Flash Image admite las siguientes relaciones de aspecto: 1:1, 3:2, 2:3, 3:4, 4:3, 4:5, 5:4, 9:16, 16:9 y 21:9.

Gemini generará una imagen basada en tu descripción. Este proceso debería tardar unos segundos, pero puede ser relativamente más lento en función de la capacidad.

Edición de imágenes en varias interacciones

Gemini 2.5 Flash Image también admite la edición multirrespuesta mejorada, lo que te permite responder al modelo con cambios después de recibir una imagen editada. De esta forma, podrás seguir editando la imagen de forma conversacional.

Ten en cuenta que se recomienda limitar el tamaño total del archivo de solicitud a un máximo de 50 MB.

Para probar la edición de imágenes en varias fases, consulta nuestro notebook de Gemini 2.5 Flash Image.