Prova la generazione di immagini (Vertex AI Studio)
Imagen su Vertex AI offre uno strumento di riscrittura dei prompt basato su LLM, noto anche come riscrittore di prompt. Il riscrivitore di prompt ti aiuta a ottenere immagini di output di qualità superiore aggiungendo più dettagli al prompt.
Se disattivi il riscrittore di prompt, la qualità delle immagini e la somiglianza dell'output con il prompt fornito potrebbero risentirne. Questa funzionalità è attivata per impostazione predefinita per le seguenti versioni del modello:
imagen-4.0-generate-001
imagen-4.0-fast-generate-001
imagen-4.0-ultra-generate-001
imagen-3.0-generate-002
Il prompt riscritto viene fornito dalla risposta dell'API solo se il prompt originale contiene meno di 30 parole.
Utilizzare il prompt rewriter
Per utilizzare il prompt rewriter:
Console
Nella console Google Cloud , vai alla pagina Vertex AI > Media Studio.
Fai clic su Immagine. Viene visualizzata la pagina di generazione di immagini di Imagen Media Studio.
Nel riquadro Impostazioni, modifica le seguenti opzioni:
Modello: scegli un modello tra le opzioni disponibili.
Per saperne di più sui modelli disponibili, consulta Modelli Imagen.
Numero di risultati: regola il cursore o inserisci un valore compreso tra 1 e 4.
Nella casella Prompt negativo, inserisci un prompt che descriva ciò che non vuoi che venga generato nell'immagine.
Nella casella Scrivi il prompt, fai clic su Aiutami a scrivere.
Viene visualizzata la finestra Migliora il mio prompt.
Nella casella Prompt attuale, scrivi il prompt e fai clic su Migliora.
Il prompt riscritto viene visualizzato nella casella Prompt migliorato. Puoi modificare il prompt avanzato o utilizzarlo così com'è.
Fai clic su Inserisci per utilizzare il prompt visualizzato.
Il prompt viene inserito nella casella Scrivi il tuo prompt.
Fai clic su
Genera.
REST
Prima di utilizzare i dati della richiesta, apporta le seguenti sostituzioni:
- PROJECT_ID: il tuo Google Cloud ID progetto.
- MODEL_VERSION: La versione del modello di generazione di immagini da utilizzare.
Per ulteriori informazioni sulle versioni e sulle funzionalità del modello, vedi Versioni del modello.
- LOCATION: la regione del progetto. Ad esempio,
us-central1
,europe-west2
oasia-northeast3
. Per un elenco delle regioni disponibili, consulta Località dell'AI generativa su Vertex AI. - TEXT_PROMPT: Il prompt di testo che guida le immagini generate dal modello. Prima di generare le immagini, questo prompt di base viene migliorato con un linguaggio più dettagliato e descrittivo utilizzando lo strumento di riscrittura dei prompt basato su LLM.
-
IMAGE_COUNT: un numero intero che descrive il numero di immagini da
generare. I valori accettati sono
1
-4
. Il valore predefinito è4
. -
PROMPT_SETTING: un valore booleano,
true
attiva i prompt avanzati efalse
li disattiva. Il valore predefinito ètrue
.
Metodo HTTP e URL:
POST https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/MODEL_VERSION:predict
Corpo JSON della richiesta:
{ "instances": [ { "prompt": "TEXT_PROMPT" } ], "parameters": { "sampleCount": IMAGE_COUNT, "enhancePrompt": PROMPT_SETTING } }
Per inviare la richiesta, scegli una di queste opzioni:
curl
Salva il corpo della richiesta in un file denominato request.json
,
ed esegui questo comando:
curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/MODEL_VERSION:predict"
PowerShell
Salva il corpo della richiesta in un file denominato request.json
,
ed esegui questo comando:
$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }
Invoke-WebRequest `
-Method POST `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/MODEL_VERSION:predict" | Select-Object -Expand Content
prompt
aggiuntivo che mostra il prompt migliorato e l'immagine
generata associata:
{ "predictions": [ { "mimeType": "MIME_TYPE", "prompt": "ENHANCED_PROMPT_1", "bytesBase64Encoded": "BASE64_IMG_BYTES_1" }, { "mimeType": "MIME_TYPE", "prompt": "ENHANCED_PROMPT_2", "bytesBase64Encoded": "BASE64_IMG_BYTES_2" } ] }
Ad esempio, la seguente risposta di esempio è per una richiesta con
"sampleCount": 2
e "prompt": "A raccoon wearing formal
clothes, wearing a top hat. Oil painting in the style of Vincent Van
Gogh."
. La risposta restituisce due oggetti di previsione, ognuno con il prompt avanzato e i byte dell'immagine generata con codifica base64.
{ "predictions": [ { "mimeType": "image/png", "prompt": "An oil painting in the style of Vincent van Gogh, depicting a raccoon adorned in a finely tailored tuxedo, complete with a crisp white shirt and a bow tie. The raccoon also sports a classic top hat, perched jauntily on its head. The painting uses thick, swirling brushstrokes characteristic of van Gogh, with vibrant hues of blue, yellow, and green in the background, contrasting with the dark tones of the raccoon's attire. The light source is subtly placed, casting a dramatic shadow of the raccoon's attire onto the surface it sits upon, further enhancing the depth and dimensionality of the composition. The overall impression is one of a whimsical and sophisticated character, a raccoon elevated to a higher class through its formal attire, rendered in van Gogh's iconic style.", "bytesBase64Encoded": "BASE64_IMG_BYTES" }, { "mimeType": "image/png", "prompt": "An oil painting in the style of Vincent van Gogh featuring a raccoon in a dapper suit, complete with a black jacket, crisp white shirt, and a black bow tie. The raccoon is wearing a black top hat, adding a touch of elegance to its ensemble. The painting is rendered with characteristic van Gogh brushwork, utilizing thick, impasto strokes of color. The background is a swirl of blues, greens, and yellows, creating a vibrant yet slightly chaotic atmosphere that contrasts with the raccoon's formal attire. The lighting is dramatic, casting sharp shadows and highlighting the textures of the fabric and the raccoon's fur, enhancing the sense of realism within the fantastical scene. The composition focuses on the raccoon's proud posture, highlighting the whimsical contrast of a wild animal dressed in formal attire, captured in the unique artistic language of van Gogh. ", "bytesBase64Encoded": "BASE64_IMG_BYTES" } ] }
Passaggi successivi
- Impostare la lingua del prompt di testo
- Configurare le proporzioni
- Omettere contenuti utilizzando un prompt negativo
- Generare immagini deterministiche