Impostare la risoluzione di output

Imagen su Vertex AI ti consente di impostare la risoluzione di output delle immagini generate quando utilizzi i seguenti modelli di Imagen 4:

  • imagen-4.0-generate-001
  • imagen-4.0-ultra-generate-001

Console

  1. Nella console Google Cloud , vai alla pagina Vertex AI > Media Studio.

    Vai a Media Studio

  2. Fai clic su Immagine. Viene visualizzata la pagina di generazione di immagini di Imagen Media Studio.

  3. Nel riquadro Impostazioni, modifica le seguenti opzioni:

    • Modello: scegli un modello tra le opzioni disponibili.

      Per saperne di più sui modelli disponibili, consulta Modelli Imagen.

    • Risoluzione output: scegli una risoluzione output tra le opzioni disponibili.

  4. Nella casella Scrivi il prompt, inserisci il prompt di testo che descrive le immagini da generare. Ad esempio, "small boat on water in the morning watercolor illustration".

  5. Fai clic su Genera.

REST

Prima di utilizzare i dati della richiesta, apporta le seguenti sostituzioni:

  • REGION: la regione in cui si trova il progetto. Per ulteriori informazioni sulle regioni supportate, consulta AI generativa su località Vertex AI.
  • TEXT_PROMPT: Il prompt di testo da utilizzare per generare immagini.
  • PROJECT_ID: il tuo Google Cloud ID progetto.
  • MODEL_VERSION: La versione del modello Imagen da utilizzare. Di seguito sono riportati i valori accettati quando utilizzi sampleImageSize:
    • imagen-4.0-generate-001
    • imagen-4.0-ultra-generate-001
  • IMAGE_RESOLUTION: La risoluzione dell'immagine di output. Sono accettati:
    • "1K"
    • "2K"

    L'impostazione predefinita è "1K".

  • IMAGE_COUNT: il numero di immagini da generare. L'intervallo di valori accettato è 1 a 4.

Metodo HTTP e URL:

POST https://REGION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/REGION/publishers/google/models/MODEL_VERSION:predict

Corpo JSON della richiesta:

{
  "instances": [
    {
      "prompt": "TEXT_PROMPT"
    }
  ],
  "parameters": {
    "sampleImageSize": "IMAGE_RESOLUTION",
    "sampleCount": IMAGE_COUNT
  }
}

Per inviare la richiesta, scegli una di queste opzioni:

curl

Salva il corpo della richiesta in un file denominato request.json, ed esegui questo comando:

curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://REGION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/REGION/publishers/google/models/MODEL_VERSION:predict"

PowerShell

Salva il corpo della richiesta in un file denominato request.json, ed esegui questo comando:

$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }

Invoke-WebRequest `
-Method POST `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://REGION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/REGION/publishers/google/models/MODEL_VERSION:predict" | Select-Object -Expand Content
La richiesta restituisce oggetti immagine. In questo esempio, vengono restituiti due oggetti immagine, con due oggetti di previsione come immagini codificate in base64.
{
  "predictions": [
    {
      "mimeType": "image/png",
      "bytesBase64Encoded": "BASE64_IMG_BYTES"
    },
    {
      "bytesBase64Encoded": "BASE64_IMG_BYTES",
      "mimeType": "image/png"
    }
  ]
}