Usare il riscrittore di prompt

Prova la generazione di immagini (Vertex AI Studio)

Provare Imagen in un Colab

Imagen su Vertex AI offre uno strumento di riscrittura dei prompt basato su LLM, noto anche come riscrittore di prompt. Il riscrivitore di prompt ti aiuta a ottenere immagini di output di qualità superiore aggiungendo più dettagli al prompt.

Se disattivi il riscrittore di prompt, la qualità delle immagini e la somiglianza dell'output con il prompt fornito potrebbero risentirne. Questa funzionalità è attivata per impostazione predefinita per le seguenti versioni del modello:

  • imagen-4.0-generate-001
  • imagen-4.0-fast-generate-001
  • imagen-4.0-ultra-generate-001
  • imagen-3.0-generate-002

Il prompt riscritto viene fornito dalla risposta dell'API solo se il prompt originale contiene meno di 30 parole.

Utilizzare il prompt rewriter

Per utilizzare il prompt rewriter:

Console

  1. Nella console Google Cloud , vai alla pagina Vertex AI > Media Studio.

    Vai a Media Studio

  2. Fai clic su Immagine. Viene visualizzata la pagina di generazione di immagini di Imagen Media Studio.

  3. Nel riquadro Impostazioni, modifica le seguenti opzioni:

    • Modello: scegli un modello tra le opzioni disponibili.

      Per saperne di più sui modelli disponibili, consulta Modelli Imagen.

    • Numero di risultati: regola il cursore o inserisci un valore compreso tra 1 e 4.

    • Nella casella Prompt negativo, inserisci un prompt che descriva ciò che non vuoi che venga generato nell'immagine.

  4. Nella casella Scrivi il prompt, fai clic su Aiutami a scrivere.

    Viene visualizzata la finestra Migliora il mio prompt.

  5. Nella casella Prompt attuale, scrivi il prompt e fai clic su Migliora.

    Il prompt riscritto viene visualizzato nella casella Prompt migliorato. Puoi modificare il prompt avanzato o utilizzarlo così com'è.

  6. Fai clic su Inserisci per utilizzare il prompt visualizzato.

    Il prompt viene inserito nella casella Scrivi il tuo prompt.

  7. Fai clic su Genera.

REST

Prima di utilizzare i dati della richiesta, apporta le seguenti sostituzioni:

  • PROJECT_ID: il tuo Google Cloud ID progetto.
  • MODEL_VERSION: La versione del modello di generazione di immagini da utilizzare.

    Per ulteriori informazioni sulle versioni e sulle funzionalità del modello, vedi Versioni del modello.

  • LOCATION: la regione del progetto. Ad esempio, us-central1, europe-west2 o asia-northeast3. Per un elenco delle regioni disponibili, consulta Località dell'AI generativa su Vertex AI.
  • TEXT_PROMPT: Il prompt di testo che guida le immagini generate dal modello. Prima di generare le immagini, questo prompt di base viene migliorato con un linguaggio più dettagliato e descrittivo utilizzando lo strumento di riscrittura dei prompt basato su LLM.
  • IMAGE_COUNT: un numero intero che descrive il numero di immagini da generare. I valori accettati sono 1-4. Il valore predefinito è 4.
  • PROMPT_SETTING: un valore booleano, true attiva i prompt avanzati e false li disattiva. Il valore predefinito è true.

Metodo HTTP e URL:

POST https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/MODEL_VERSION:predict

Corpo JSON della richiesta:

{
  "instances": [
    {
      "prompt": "TEXT_PROMPT"
    }
  ],
  "parameters": {
    "sampleCount": IMAGE_COUNT,
    "enhancePrompt": PROMPT_SETTING
  }
}

Per inviare la richiesta, scegli una di queste opzioni:

curl

Salva il corpo della richiesta in un file denominato request.json, ed esegui questo comando:

curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/MODEL_VERSION:predict"

PowerShell

Salva il corpo della richiesta in un file denominato request.json, ed esegui questo comando:

$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }

Invoke-WebRequest `
-Method POST `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/MODEL_VERSION:predict" | Select-Object -Expand Content
Se il miglioramento del prompt è attivato, la risposta include un campo prompt aggiuntivo che mostra il prompt migliorato e l'immagine generata associata:
  {
    "predictions": [
      {
        "mimeType": "MIME_TYPE",
        "prompt": "ENHANCED_PROMPT_1",
        "bytesBase64Encoded": "BASE64_IMG_BYTES_1"
      },
      {
        "mimeType": "MIME_TYPE",
        "prompt": "ENHANCED_PROMPT_2",
        "bytesBase64Encoded": "BASE64_IMG_BYTES_2"
      }
    ]
  }

Ad esempio, la seguente risposta di esempio è per una richiesta con "sampleCount": 2 e "prompt": "A raccoon wearing formal clothes, wearing a top hat. Oil painting in the style of Vincent Van Gogh.". La risposta restituisce due oggetti di previsione, ognuno con il prompt avanzato e i byte dell'immagine generata con codifica base64.

{
  "predictions": [
    {
      "mimeType": "image/png",
      "prompt": "An oil painting in the style of Vincent van Gogh,
        depicting a raccoon adorned in a finely tailored tuxedo, complete with a
        crisp white shirt and a bow tie. The raccoon also sports a classic top
        hat, perched jauntily on its head. The painting uses thick, swirling
        brushstrokes characteristic of van Gogh, with vibrant hues of blue,
        yellow, and green in the background, contrasting with the dark tones of
        the raccoon's attire. The light source is subtly placed, casting a
        dramatic shadow of the raccoon's attire onto the surface it sits upon,
        further enhancing the depth and dimensionality of the composition. The
        overall impression is one of a whimsical and sophisticated character, a
        raccoon elevated to a higher class through its formal attire, rendered
        in van Gogh's iconic style.",
      "bytesBase64Encoded": "BASE64_IMG_BYTES"
    },
    {
      "mimeType": "image/png",
      "prompt": "An oil painting in the style of Vincent van Gogh featuring
        a raccoon in a dapper suit, complete with a black jacket, crisp white
        shirt, and a black bow tie. The raccoon is wearing a black top hat,
        adding a touch of elegance to its ensemble. The painting is rendered
        with characteristic van Gogh brushwork, utilizing thick, impasto strokes
        of color. The background is a swirl of blues, greens, and yellows,
        creating a vibrant yet slightly chaotic atmosphere that contrasts with
        the raccoon's formal attire. The lighting is dramatic, casting sharp
        shadows and highlighting the textures of the fabric and the raccoon's
        fur, enhancing the sense of realism within the fantastical scene. The
        composition focuses on the raccoon's proud posture, highlighting the
        whimsical contrast of a wild animal dressed in formal attire, captured
        in the unique artistic language of van Gogh. ",
      "bytesBase64Encoded": "BASE64_IMG_BYTES"
    }
  ]
}

Passaggi successivi