Définir la résolution de sortie

Imagen sur Vertex AI vous permet de définir la résolution de sortie des images générées lorsque vous utilisez les modèles Imagen 4 suivants :

  • imagen-4.0-generate-001
  • imagen-4.0-ultra-generate-001

Console

  1. Dans la console Google Cloud , accédez à la page Vertex AI>Media Studio.

    Accéder à Media Studio

  2. Cliquez sur Imagen. La page de génération d'images d'Imagen Media Studio s'affiche.

  3. Dans le panneau Paramètres, ajustez les options suivantes :

    • Modèle : sélectionnez un modèle parmi les options disponibles.

      Pour en savoir plus sur les modèles disponibles, consultez Modèles Imagen.

    • Résolution de sortie : choisissez une résolution de sortie parmi les options disponibles.

  4. Dans la zone Écrivez votre requête, saisissez votre requête textuelle décrivant les images à générer. Exemple :"small boat on water in the morning watercolor illustration"

  5. Cliquez sur Générer.

REST

Avant d'utiliser les données de requête, effectuez les remplacements suivants :

  • REGION : région dans laquelle se trouve votre projet. Pour en savoir plus sur les régions compatibles, consultez Emplacements de l'IA générative sur Vertex AI.
  • TEXT_PROMPT : requête textuelle à utiliser pour générer des images.
  • PROJECT_ID : ID de votre projet Google Cloud .
  • MODEL_VERSION : Version du modèle Imagen à utiliser. Les valeurs suivantes sont acceptées lorsque vous utilisez sampleImageSize :
    • imagen-4.0-generate-001
    • imagen-4.0-ultra-generate-001
  • IMAGE_RESOLUTION : résolution de l'image de sortie. Les éléments suivants sont acceptés :
    • "1K"
    • "2K"

    Le paramètre par défaut est "1K".

  • IMAGE_COUNT : nombre d'images à générer. La plage de valeurs acceptée est comprise entre 1 et 4.

Méthode HTTP et URL :

POST https://REGION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/REGION/publishers/google/models/MODEL_VERSION:predict

Corps JSON de la requête :

{
  "instances": [
    {
      "prompt": "TEXT_PROMPT"
    }
  ],
  "parameters": {
    "sampleImageSize": "IMAGE_RESOLUTION",
    "sampleCount": IMAGE_COUNT
  }
}

Pour envoyer votre requête, choisissez l'une des options suivantes :

curl

Enregistrez le corps de la requête dans un fichier nommé request.json, puis exécutez la commande suivante :

curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://REGION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/REGION/publishers/google/models/MODEL_VERSION:predict"

PowerShell

Enregistrez le corps de la requête dans un fichier nommé request.json, puis exécutez la commande suivante :

$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }

Invoke-WebRequest `
-Method POST `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://REGION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/REGION/publishers/google/models/MODEL_VERSION:predict" | Select-Object -Expand Content
La requête renvoie des objets image. Dans cet exemple, deux objets image sont renvoyés, avec deux objets de prédiction sous forme d'images encodées en base64.
{
  "predictions": [
    {
      "mimeType": "image/png",
      "bytesBase64Encoded": "BASE64_IMG_BYTES"
    },
    {
      "bytesBase64Encoded": "BASE64_IMG_BYTES",
      "mimeType": "image/png"
    }
  ]
}