Cette page a été traduite par l'API Cloud Translation.

Modifier des images avec Gemini

Attention : La génération d'images Gemini 2.0 Flash sera abandonnée le 26 septembre 2025 . gemini-2.0-flash-preview-image-generation sera supprimé le 26 septembre 2025 . Migrez tous les workflows vers gemini-2.5-flash-image-preview.

Aperçu

Ce produit ou cette fonctionnalité est une offre d'aperçu d'IA générative, soumise aux "Conditions des offres de pré-DG" des Conditions spécifiques du service Google Cloud, ainsi qu'aux Conditions supplémentaires relatives aux produits d'IA générative en version preview. Pour cette offre d'aperçu de l'IA générative, les clients peuvent choisir de l'utiliser à des fins de production ou commerciales, ou de divulguer les résultats générés à des tiers. Ils peuvent également traiter les données à caractère personnel comme indiqué dans l'Avenant relatif au traitement des données dans le cloud, sous réserve des obligations et restrictions décrites dans le contrat en vertu duquel vous accédez à Google Cloud. Les produits de pré-DG sont disponibles "en l'état" et peuvent avoir une prise en charge limitée. Pour en savoir plus, consultez les descriptions des étapes de lancement.

L'aperçu Gemini 2.5 Flash Image est compatible avec plusieurs types de retouche d'image.

Édition d'images

La version Preview publique de Gemini 2.5 Flash Image pour la génération d'images (gemini-2.5-flash-image-preview) permet de modifier les images en plus de les générer. Avec cette version Preview publique, l'image Gemini 2.5 Flash permet de mieux modifier les images et d'effectuer des modifications en plusieurs étapes. Elle contient également des filtres de sécurité mis à jour qui offrent une expérience utilisateur plus flexible et moins restrictive.

Il est compatible avec les modalités et les fonctionnalités suivantes :

Retouche d'images (texte vers image et image vers image)
- Exemple de requête : "Modifie cette image pour qu'elle ressemble à un dessin animé"
- Exemple de requête : [image de chat] + [image d'oreiller] + "Crée un point de croix de mon chat sur cet oreiller."
Modification d'images multitour (chat)
- Exemples de requêtes : [importe une image d'une voiture bleue]. "Transforme cette voiture en cabriolet." "Maintenant, change la couleur en jaune." "Ajoute un spoiler."

Modifier une image

Console

Pour modifier des images :

Ouvrez Vertex AI Studio > Créer une requête.
Cliquez sur Changer de modèle, puis sélectionnez gemini-2.5-flash-image-preview dans le menu.
Dans le panneau Sorties, sélectionnez Image et texte dans le menu déroulant.
Cliquez sur Insérer un média (), sélectionnez une source dans le menu, puis suivez les instructions de la boîte de dialogue.
Dans la zone de texte Écrivez une requête, décrivez les modifications que vous souhaitez apporter à l'image.
Cliquez sur le bouton Requête ().

Gemini générera une version modifiée de l'image fournie en fonction de votre description. Ce processus devrait prendre quelques secondes, mais peut être relativement plus lent en fonction de la capacité.

Python

Installer

pip install --upgrade google-genai

Pour en savoir plus, lisez la documentation de référence du SDK.

Définissez les variables d'environnement pour utiliser le SDK Gen AI avec Vertex AI :

# Replace the `GOOGLE_CLOUD_PROJECT` and `GOOGLE_CLOUD_LOCATION` values
# with appropriate values for your project.
export GOOGLE_CLOUD_PROJECT=GOOGLE_CLOUD_PROJECT
export GOOGLE_CLOUD_LOCATION=global
export GOOGLE_GENAI_USE_VERTEXAI=True

from google import genai
from google.genai.types import GenerateContentConfig, Modality
from PIL import Image
from io import BytesIO

client = genai.Client()

# Using an image of Eiffel tower, with fireworks in the background.
image = Image.open("test_resources/example-image-eiffel-tower.png")

response = client.models.generate_content(
    model="gemini-2.5-flash-image-preview",
    contents=[image, "Edit this image to make it look like a cartoon."],
    config=GenerateContentConfig(response_modalities=[Modality.TEXT, Modality.IMAGE]),
)
for part in response.candidates[0].content.parts:
    if part.text:
        print(part.text)
    elif part.inline_data:
        image = Image.open(BytesIO((part.inline_data.data)))
        image.save("output_folder/bw-example-image.png")
# Example response:
#  Here's the cartoon-style edit of the image:
#  Cartoon-style edit:
#  - Simplified the Eiffel Tower with bolder lines and slightly exaggerated proportions.
#  - Brightened and saturated the colors of the sky, fireworks, and foliage for a more vibrant, cartoonish look.
#  ....

REST

Exécutez la commande suivante dans le terminal pour créer ou écraser ce fichier dans le répertoire actuel :

curl -X POST \
  -H "Authorization: Bearer $(gcloud auth print-access-token)" \
  -H "Content-Type: application/json" \
  https://${API_ENDPOINT}:generateContent \
  -d '{
    "contents": {
      "role": "USER",
      "parts": [
        {"file_data": {
          "mime_type": "image/jpg",
          "file_uri": "<var>FILE_NAME</var>"
          }
        },
        {"text": "Convert this photo to black and white, in a cartoonish style."},
      ]

    },
    "generation_config": {
      "response_modalities": ["TEXT", "IMAGE"],
    },
    "safetySettings": {
      "method": "PROBABILITY",
      "category": "HARM_CATEGORY_DANGEROUS_CONTENT",
      "threshold": "BLOCK_MEDIUM_AND_ABOVE"
    },
  }' 2>/dev/null >response.json

Remarque : Vous devez inclure responseModalities: ["TEXT", "IMAGE"] dans votre configuration. La sortie d'image uniquement n'est pas disponible avec ces modèles.

Gemini génère une image en fonction de votre description. Ce processus devrait prendre quelques secondes, mais peut être relativement plus lent en fonction de la capacité.

Modification d'images multitour

Gemini 2.5 Flash Image Preview permet également d'améliorer la retouche multitour. Vous pouvez ainsi répondre au modèle en lui demandant d'apporter des modifications après avoir reçu une image retouchée. Vous pourrez ainsi continuer à modifier l'image de manière conversationnelle.

Notez qu'il est recommandé de limiter la taille totale du fichier de requête à 50 Mo maximum.

Pour tester la retouche d'images en plusieurs étapes, essayez notre notebook Gemini 2.5 Flash Image Preview.

Modifier des images avec Gemini Restez organisé à l'aide des collections Enregistrez et classez les contenus selon vos préférences.

Édition d'images

Modifier une image

Console

Python

Installer

REST

Modification d'images multitour

Modifier des images avec Gemini