Le produit Imagen recontext sur l'API Vertex AI vous permet de modifier des images de produits en les insérant dans différentes scènes ou en les plaçant sur différents arrière-plans. Vous fournissez une image d'un produit et un prompt, et le produit Imagen recontextualise les images de votre produit dans de nouvelles scènes ou avec différents arrière-plans.
Pour demander l'accès à la fonctionnalité de recontextualisation de produits Imagen, remplissez le formulaire Vertex AI – Demande d'accès à Generative Media for Marketing.
Versions de modèles compatibles
La recontextualisation de produits Imagen est compatible avec les modèles suivants :
imagen-product-recontext-preview-06-30
Pour en savoir plus sur les fonctionnalités compatibles avec le modèle, consultez Modèles Imagen.
Requête HTTP
curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/MODEL_ID:predict \
-d '{
"instances": [
{
"prompt": string,
"productImages": [
// The following fields can be repeated up to 3 times for different
// views of the same product.
{
"image": {
// Union field can be only one of the following:
"bytesBase64Encoded": string,
"gcsUri": string,
// End of list of possible types for union field.
},
}
]
}
],
"parameters": {
"addWatermark": boolean,
"enhancePrompt": boolean
"personGeneration": string,
"safetySetting": string,
"sampleCount": integer,
"seed": integer,
"storageUri": string,
"outputOptions": {
"mimeType": string,
"compressionQuality": integer
}
}
}'
Instances
Instances | |
---|---|
prompt |
Facultatif. Requête textuelle pour guider la génération de la scène. |
productImages |
Liste de trois
|
Objet productImages
L'objet productImages
décrit les composants Image à placer dans différentes scènes ou arrière-plans.
productImages |
|
---|---|
Champ d'union
Image du produit |
|
bytesBase64Encoded |
Chaîne d'octets encodée en base64 d'un fichier image ou vidéo. |
gcsUri |
URI de chaîne vers un emplacement de bucket Cloud Storage. |
Paramètres
Paramètres | |
---|---|
addWatermark |
Facultatif. Ajoute un filigrane invisible aux images générées.
La valeur par défaut est |
enhancePrompt |
Facultatif. Paramètre facultatif permettant d'utiliser une fonctionnalité de reformulation de requête basée sur un LLM pour générer des images de meilleure qualité qui reflètent mieux l'intention de la requête d'origine. La désactivation de cette fonctionnalité peut avoir un impact sur la qualité de l'image et le respect de la requête.
La valeur par défaut est |
personGeneration |
Facultatif. Autorise ou non la génération de personnes par le modèle. Les valeurs suivantes sont acceptées :
La valeur par défaut est |
safetySetting |
Facultatif. Ajoute un niveau de filtrage de sécurité. Les valeurs suivantes sont acceptées :
La valeur par défaut est |
|
Nombre d'images à générer.
Valeur entière comprise entre |
seed |
Facultatif. Graine aléatoire pour la génération d'images. Ce paramètre n'est pas disponible lorsque
Si |
storageUri |
Facultatif. URI de chaîne vers un emplacement de bucket Cloud Storage utilisé pour stocker les images générées. Si aucun bucket Cloud Storage n'est fourni, les octets d'image encodés en base64 sont renvoyés dans la réponse. |
outputOptions |
Facultatif. Décrit le format des images de sortie dans un objet |
Objet outputOptions
L'objet outputOptions
décrit la sortie d'image.
Paramètres | |
---|---|
outputOptions.mimeType |
Facultatif : Format de sortie de l'image. Les valeurs suivantes sont acceptées :
La valeur par défaut est |
outputOptions.compressionQuality |
Facultatif :
Niveau de compression si le type de sortie est |
Exemple de requête
REST
Avant d'utiliser les données de requête, effectuez les remplacements suivants :
-
REGION
: région dans laquelle se trouve votre projet. Pour en savoir plus sur les régions compatibles, consultez Emplacements de l'IA générative sur Vertex AI. -
PROJECT_ID
: ID de votre projet Google Cloud . -
TEXT_PROMPT
: facultatif. Une requête textuelle pour guider les images générées par le modèle. -
BASE64_SUBJECT_IMAGE
: image encodée en base64 de l'image du sujet. -
PERSON_SETTING
: facultatif. Valeur de chaîne qui contrôle le type de génération de personnes ou de visages autorisé par le modèle. Vous pouvez utiliser les valeurs suivantes pourpersonGeneration
:-
"allow_adult"
: autorise uniquement la génération d'adultes, à l'exception de la génération de célébrités. La génération de célébrités n'est autorisée pour aucun paramètre. Il s'agit du paramètre par défaut. -
"allow_all"
: autorise la génération de personnes de tous âges, à l'exception de la génération de célébrités. La génération de célébrités n'est autorisée pour aucun paramètre. -
"dont_allow"
: ne permet pas de générer des personnes ni des visages dans les résultats.
-
-
SAFETY_SETTING
: facultatif. Valeur de chaîne qui contrôle le seuil du filtre de sécurité pour les images générées. Vous pouvez utiliser les valeurs suivantes pour sélectionner votre paramètre de sécurité :-
"block_low_and_above"
: seuil de sécurité le plus strict."block_low_and_above"
filtre le plus grand nombre d'images générées. -
"block_medium_and_above"
: seuil de sécurité moyen qui équilibre le filtrage des contenus potentiellement dangereux et sécurisés."block_medium_and_above"
est le paramètre de sécurité par défaut. -
"block_only_high"
: seuil de sécurité le plus bas, qui réduit le nombre de requêtes bloquées en raison du filtre de sécurité. L'utilisation du seuil de sécurité"block_only_high"
peut augmenter le nombre d'images répréhensibles générées par le modèle.
-
-
WATERMARK_SETTING
: Facultatif : valeur booléenne. Lorsque cette valeur est définie surtrue
, le modèle ajoute un filigrane numérique que vous pouvez utiliser pour vérifier l'image générée. La valeur par défaut esttrue
. -
IMAGE_COUNT
: nombre d'images à générer. La plage de valeurs acceptée est1
-4
. -
PROMPT_SETTING
: Facultatif : valeur booléenne. Lorsque cette valeur est définie surtrue
, le modèle utilise des prmopts améliorés. La valeur par défaut esttrue
.
Méthode HTTP et URL :
POST https://REGION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/REGION/publishers/google/models/imagen-product-recontext-preview-06-30:predict
Corps JSON de la requête :
{ "instances": [ { "prompt": "TEXT_PROMPT", "productImages": [ { "image": { "bytesBase64Encoded": "BASE64_SUBJECT_IMAGE" }, } ] } ], "parameters": { "personGeneration": PERSON_SETTING, "safetySetting": SAFETY_SETTING, "addWatermark": WATERMARK_SETTING, "sampleCount": IMAGE_COUNT, "enhancePrompt": PROMPT_SETTING } }
Pour envoyer votre requête, choisissez l'une des options suivantes :
curl
Enregistrez le corps de la requête dans un fichier nommé request.json
, puis exécutez la commande suivante :
curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://REGION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/REGION/publishers/google/models/imagen-product-recontext-preview-06-30:predict"
PowerShell
Enregistrez le corps de la requête dans un fichier nommé request.json
, puis exécutez la commande suivante :
$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }
Invoke-WebRequest `
-Method POST `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://REGION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/REGION/publishers/google/models/imagen-product-recontext-preview-06-30:predict" | Select-Object -Expand Content
{ "predictions": [ { "mimeType": "image/png", "bytesBase64Encoded": "BASE64_IMG_BYTES" }, { "bytesBase64Encoded": "BASE64_IMG_BYTES", "mimeType": "image/png" } ] }