Cette page a été traduite par l'API Cloud Translation.

Omettre du contenu à l'aide d'une requête négative

Attention : Les versions 1 et 2 d'Imagen seront obsolètes à partir du 24 juin 2025. Les modèles Imagen imagegeneration@002, imagegeneration@005 et imagegeneration@006 seront supprimés le 24 septembre 2025 . Pour en savoir plus sur la migration vers Imagen 3, consultez Migrer vers Imagen 3.

Essayer Imagen dans Colab

Cette page explique comment omettre du contenu des images générées par Imagen sur Vertex AI.

Une requête négative est une description de ce que vous souhaitez omettre dans les images générées. Prenons l'exemple de la requête "Une rue pluvieuse la nuit sans personne". Le modèle peut interpréter "personne" comme une instruction d'inclusion plutôt que d'omission. Pour générer de meilleurs résultats, vous pouvez utiliser le prompt une rue sous la pluie la nuit avec un prompt négatif personne.

Voici des exemples d'images générées par Imagen avec et sans prompt négatif :

Prompt textuel uniquement

Text prompt: "a pizza"

trois exemples d'images de pizza

Prompt textuel et prompt négatif

Prompt textuel : une pizza
Prompt négatif : pepperoni

trois exemples d'images de pizza sans pepperoni

Les modèles suivants sont compatibles avec les invites négatives :

imagen-3.0-capability-001
imagen-3.0-fast-generate-001
imagen-3.0-generate-001

Utiliser une requête négative

Pour omettre du contenu dans les images générées, procédez comme suit :

Console

Dans la console Google Cloud , accédez à la page Vertex AI>Media Studio.

Accéder à Media Studio
Cliquez sur Imagen. La page de génération d'images d'Imagen Media Studio s'affiche.
Dans le panneau Paramètres, ajustez les options suivantes :
- Modèle : sélectionnez un modèle parmi les options disponibles.
  
  Pour en savoir plus sur les modèles disponibles, consultez Modèles Imagen.
- Nombre de résultats : ajustez le curseur ou saisissez une valeur comprise entre 1 et 4.
- Dans la zone Requête négative, saisissez une requête décrivant ce que vous ne souhaitez pas voir dans l'image.
Dans la zone Écrivez votre requête, saisissez votre requête textuelle décrivant les images à générer. Par exemple, illustration en aquarelle d'un petit bateau sur l'eau le matin.

Pour en savoir plus sur la rédaction de requêtes efficaces, consultez le guide des requêtes et des attributs d'image.
Cliquez sur Générer.

REST

La requête négative est un champ facultatif dans l'objet parameters du corps d'une requête JSON.

Avant d'utiliser les données de requête, effectuez les remplacements suivants :

PROJECT_ID : ID de votre projet Google Cloud .
MODEL_VERSION : version du modèle Imagen à utiliser. Pour en savoir plus sur les modèles disponibles, consultez Modèles Imagen.
LOCATION : région de votre projet. (us-central1, europe-west2 ou asia-northeast3, par exemple). Pour obtenir la liste des régions disponibles, consultez IA générative sur les emplacements Vertex AI.
TEXT_PROMPT : prompt textuel qui guide le modèle pour la génération d'images. Ce champ est obligatoire pour la génération et la modification.
IMAGE_COUNT : nombre d'images générées. Valeurs entières acceptées : de 1 à 8 (imagegeneration@002), de 1 à 4 (toutes les autres versions de modèle). Valeur par défaut : 4.

Paramètres facultatifs supplémentaires

Utilisez les variables facultatives suivantes en fonction de votre cas d'utilisation. Ajoutez l'ensemble ou une partie des paramètres suivants dans l'objet "parameters": {}. Cette liste présente des paramètres facultatifs courants et n'est pas exhaustive. Pour en savoir plus sur les paramètres facultatifs, consultez la section "Générer des images" de la documentation de référence de l'API Imagen.

"parameters": {
  "sampleCount": IMAGE_COUNT,
  "addWatermark": ADD_WATERMARK,
  "aspectRatio": "ASPECT_RATIO",
  "enhancePrompt": ENABLE_PROMPT_REWRITING,
  "includeRaiReason": INCLUDE_RAI_REASON,
  "includeSafetyAttributes": INCLUDE_SAFETY_ATTRIBUTES,
  "outputOptions": {
    "mimeType": "MIME_TYPE",
    "compressionQuality": COMPRESSION_QUALITY
  },
  "personGeneration": "PERSON_SETTING",
  "safetySetting": "SAFETY_SETTING",
  "seed": SEED_NUMBER,
  "storageUri": "OUTPUT_STORAGE_URI"
}

ADD_WATERMARK : valeur booléenne. Facultatif. Active ou non un filigrane pour les images générées. Toute image générée lorsque le champ est défini sur true contient un SynthID numérique que vous pouvez utiliser pour vérifier une image avec filigrane. Si vous omettez ce champ, la valeur par défaut true est utilisée. Vous devez définir la valeur sur false pour désactiver cette fonctionnalité. Vous pouvez utiliser le champ seed pour obtenir un résultat déterministe uniquement lorsque ce champ est défini sur false.
ASPECT_RATIO : chaîne. Facultatif. Un paramètre du mode de génération qui contrôle le format. Valeurs de format acceptées et utilisation prévue :
- 1:1 (par défaut, carré)
- 3:4 (publicités, réseaux sociaux)
- 4:3 (TV, photographie)
- 16:9 (paysage)
- 9:16 (portrait)
ENABLE_PROMPT_REWRITING : valeur booléenne. Facultatif. Paramètre permettant d'utiliser une fonctionnalité de reformulation de requête basée sur un LLM pour générer des images de meilleure qualité qui reflètent mieux l'intention de la requête d'origine. La désactivation de cette fonctionnalité peut avoir un impact sur la qualité de l'image et le respect de la requête. Valeur par défaut : true.
INCLUDE_RAI_REASON : valeur booléenne. Facultatif. Indique si le code de motif de filtrage par IA responsable doit être activé dans les réponses comportant une entrée ou une sortie bloquée. Valeur par défaut : true.
INCLUDE_SAFETY_ATTRIBUTES : valeur booléenne. Facultatif. Indique si les scores d'IA responsable doivent être arrondis pour une liste d'attributs de sécurité dans les réponses d'entrée et de sortie non filtrées. Catégories d'attributs de sécurité : "Death, Harm & Tragedy", "Firearms & Weapons", "Hate", "Health", "Illicit Drugs", "Politics", "Porn", "Religion & Belief", "Toxic", "Violence", "Vulgarity" et "War & Conflict". Valeur par défaut : false.
MIME_TYPE : chaîne. Facultatif. Type MIME du contenu de l'image. Valeurs disponibles :
- image/jpeg
- image/gif
- image/png
- image/webp
- image/bmp
- image/tiff
- image/vnd.microsoft.icon
COMPRESSION_QUALITY : entier. Facultatif. S'applique uniquement aux fichiers de sortie JPEG. Niveau de détail conservé par le modèle pour les images générées au format JPEG. Valeurs : de 0 à 100. Plus la valeur est élevée, plus la compression est importante. Par défaut : 75.
PERSON_SETTING : chaîne. Facultatif. Paramètre de sécurité qui contrôle le type de génération de personnes ou de visages autorisé par le modèle. Valeurs disponibles :
- allow_adult (par défaut) : autorise uniquement la génération d'adultes, à l'exception de la génération de célébrités. La génération de célébrités n'est autorisée pour aucun paramètre.
- dont_allow : désactive l'inclusion de personnes ou de visages dans les images générées.
SAFETY_SETTING : chaîne. Facultatif. Paramètre qui contrôle les seuils de filtre de sécurité pour les images générées. Valeurs disponibles :
- block_low_and_above : seuil de sécurité le plus élevé qui entraîne le filtrage de la plus grande quantité d'images générées. Valeur précédente : block_most.
- block_medium_and_above (par défaut) : seuil de sécurité moyen qui équilibre le filtrage des contenus potentiellement dangereux et sécurisés. Valeur précédente : block_some.
- block_only_high : seuil de sécurité qui réduit le nombre de requêtes bloquées en raison de filtres de sécurité. Ce paramètre peut augmenter le volume de contenus répréhensibles générés par Imagen. Valeur précédente : block_few.
SEED_NUMBER : entier. Facultatif. Tout entier non négatif que vous fournissez pour rendre les images de sortie déterministes. Fournir le même numéro de seed génère toujours les mêmes images de sortie. Si le modèle que vous utilisez est compatible avec les filigranes numériques, vous devez définir "addWatermark": false pour utiliser ce champ. Valeurs entières acceptées : de 1 à 2147483647.
OUTPUT_STORAGE_URI : chaîne. Facultatif. Bucket Cloud Storage utilisé pour stocker les images de sortie. Si aucune valeur n'est fournie, les octets d'image encodés en base64 sont renvoyés dans la réponse. Exemple de valeur : gs://image-bucket/output/.

Méthode HTTP et URL :

POST https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/MODEL_VERSION:predict

Corps JSON de la requête :

{
  "instances": [
    {
      "prompt": "TEXT_PROMPT"
    }
  ],
  "parameters": {
    "sampleCount": IMAGE_COUNT
  }
}

Pour envoyer votre requête, choisissez l'une des options suivantes :

curl

Remarque : Pour la commande suivante, nous partons du principe que vous vous êtes connecté à la CLI gcloud avec votre compte utilisateur en exécutant la commande gcloud init ou gcloud auth login, ou en utilisant Cloud Shell, qui vous connecte automatiquement à la CLI gcloud. Vous pouvez exécuter la commande gcloud auth list pour vérifier quel est le compte actuellement actif.

Enregistrez le corps de la requête dans un fichier nommé request.json, puis exécutez la commande suivante :

curl -X POST \
     -H "Authorization: Bearer $(gcloud auth print-access-token)" \
     -H "Content-Type: application/json; charset=utf-8" \
     -d @request.json \
     "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/MODEL_VERSION:predict"

PowerShell

Remarque : Pour la commande suivante, nous partons du principe que vous vous êtes connecté à la CLI gcloud avec votre compte utilisateur en exécutant la commande gcloud init ou gcloud auth login. Vous pouvez exécuter la commande gcloud auth list pour vérifier quel est le compte actuellement actif.

Enregistrez le corps de la requête dans un fichier nommé request.json, puis exécutez la commande suivante :

$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }

Invoke-WebRequest `
    -Method POST `
    -Headers $headers `
    -ContentType: "application/json; charset=utf-8" `
    -InFile request.json `
    -Uri "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/MODEL_VERSION:predict" | Select-Object -Expand Content

L'exemple de réponse suivant concerne une requête avec

"sampleCount":
  2

. La réponse renvoie deux objets de prédiction, avec les octets d'image générés encodés en base64.

{
  "predictions": [
    {
      "bytesBase64Encoded": "BASE64_IMG_BYTES",
      "mimeType": "image/png"
    },
    {
      "mimeType": "image/png",
      "bytesBase64Encoded": "BASE64_IMG_BYTES"
    }
  ]
}

Si vous utilisez un modèle compatible avec l'amélioration des requêtes, la réponse inclut un champ prompt supplémentaire avec la requête améliorée utilisée pour la génération :

{
  "predictions": [
    {
      "mimeType": "MIME_TYPE",
      "prompt": "ENHANCED_PROMPT_1",
      "bytesBase64Encoded": "BASE64_IMG_BYTES_1"
    },
    {
      "mimeType": "MIME_TYPE",
      "prompt": "ENHANCED_PROMPT_2",
      "bytesBase64Encoded": "BASE64_IMG_BYTES_2"
    }
  ]
}

Remplacez les éléments suivants :
- NEGATIVE_PROMPT : prompt négatif pour aider le modèle à générer les images. Par exemple : "animaux" (supprime les animaux), "floutage" (rend l'image plus claire), "texte" (supprime le texte) ou "recadrer" (supprime les images recadrées).
```
{
  "instances": [
    ...
  ],
  "parameters": {
    "sampleCount": IMAGE_COUNT,
    "negativePrompt": "NEGATIVE_PROMPT"
  }
}
```

Omettre du contenu à l'aide d'une requête négative

Utiliser une requête négative

Console

REST

curl

PowerShell

Étapes suivantes