Bildgenerierung ausprobieren (Vertex AI Studio)
Imagen in einem Colab ausprobieren
Imagen in Vertex AI bietet ein LLM-basiertes Tool zum Umschreiben von Prompts, auch als Prompt-Rewriter bezeichnet. Mit dem Prompt-Rewriter können Sie die Qualität der generierten Bilder verbessern, indem Sie Ihrem Prompt mehr Details hinzufügen.
Wenn Sie die Funktion zum Umschreiben von Prompts deaktivieren, kann sich das auf die Qualität der Bilder und darauf auswirken, wie gut die Ausgabe dem von Ihnen angegebenen Prompt entspricht. Diese Funktion ist standardmäßig für die folgenden Modellversionen aktiviert:
imagen-4.0-generate-001
imagen-4.0-fast-generate-001
imagen-4.0-ultra-generate-001
imagen-3.0-generate-002
Der umformulierte Prompt wird nur dann in der API-Antwort zurückgegeben, wenn der ursprüngliche Prompt weniger als 30 Wörter umfasst.
Prompt-Rewriter verwenden
So verwenden Sie die Funktion zum Umschreiben von Prompts:
Konsole
Rufen Sie in der Google Cloud Console die Seite Vertex AI > Media Studio auf.
Klicken Sie auf Imagen. Die Seite zur Bildgenerierung von Imagen Media Studio wird angezeigt.
Passen Sie im Bereich Einstellungen die folgenden Optionen an:
Modell: Wählen Sie ein Modell aus den verfügbaren Optionen aus.
Weitere Informationen zu den verfügbaren Modellen finden Sie unter Imagen-Modelle.
Anzahl der Ergebnisse: Stellen Sie den Schieberegler ein oder geben Sie einen Wert zwischen 1 und 4 ein.
Geben Sie im Feld Negativer Prompt einen Prompt ein, der beschreibt, was nicht im Bild generiert werden soll.
Klicken Sie im Feld Prompt eingeben auf Formuliere für mich.
Das Fenster Prompt optimieren wird angezeigt.
Geben Sie im Feld Aktueller Prompt Ihren Prompt ein und klicken Sie dann auf Optimieren.
Der neu formulierte Prompt wird im Feld Optimierter Prompt angezeigt. Sie können den optimierten Prompt bearbeiten oder ihn so verwenden, wie er angezeigt wird.
Klicken Sie auf Einfügen, um den angezeigten Prompt zu verwenden.
Der Prompt wird in das Feld Geben Sie Ihren Prompt ein eingefügt.
Klicken Sie auf
Erstellen.
REST
Ersetzen Sie diese Werte in den folgenden Anfragedaten:
- PROJECT_ID: Ihre Google Cloud Projekt-ID.
- MODEL_VERSION: Die zu verwendende Modellversion für die Bildgenerierung.
Weitere Informationen zu Modellversionen und -funktionen finden Sie unter Modellversionen.
- LOCATION: Die Region Ihres Projekts. Beispiel:
us-central1
,europe-west2
oderasia-northeast3
. Eine Liste der verfügbaren Regionen finden Sie unter Generative AI an Vertex AI-Standorten. - TEXT_PROMPT: Der Text-Prompt, der bestimmt, welche Bilder das Modell generiert. Bevor Bilder generiert werden, wird dieser Basis-Prompt mit dem LLM-basierten Tool zum Neuschreiben von Prompts mit weiteren Details und beschreibenderen Formulierungen optimiert.
-
IMAGE_COUNT: Eine Ganzzahl, die die Anzahl der zu generierenden Bilder angibt. Die zulässigen Werte sind
1
–4
. Der Standardwert ist4
. -
PROMPT_SETTING: Ein boolescher Wert. Mit
true
werden erweiterte Prompts aktiviert, mitfalse
deaktiviert. Der Standardwert isttrue
.
HTTP-Methode und URL:
POST https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/MODEL_VERSION:predict
JSON-Text der Anfrage:
{ "instances": [ { "prompt": "TEXT_PROMPT" } ], "parameters": { "sampleCount": IMAGE_COUNT, "enhancePrompt": PROMPT_SETTING } }
Wenn Sie die Anfrage senden möchten, wählen Sie eine der folgenden Optionen aus:
curl
Speichern Sie den Anfragetext in einer Datei mit dem Namen request.json
und führen Sie den folgenden Befehl aus:
curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/MODEL_VERSION:predict"
PowerShell
Speichern Sie den Anfragetext in einer Datei mit dem Namen request.json
und führen Sie den folgenden Befehl aus:
$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }
Invoke-WebRequest `
-Method POST `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/MODEL_VERSION:predict" | Select-Object -Expand Content
prompt
-Feld mit dem optimierten Prompt und dem zugehörigen generierten Bild:
{ "predictions": [ { "mimeType": "MIME_TYPE", "prompt": "ENHANCED_PROMPT_1", "bytesBase64Encoded": "BASE64_IMG_BYTES_1" }, { "mimeType": "MIME_TYPE", "prompt": "ENHANCED_PROMPT_2", "bytesBase64Encoded": "BASE64_IMG_BYTES_2" } ] }
Die folgende Beispielantwort bezieht sich beispielsweise auf eine Anfrage mit "sampleCount": 2
und "prompt": "A raccoon wearing formal
clothes, wearing a top hat. Oil painting in the style of Vincent Van
Gogh."
. Die Antwort gibt zwei Vorhersageobjekte zurück, jeweils mit dem optimierten Prompt und den generierten Bildbyte, die base64-codiert sind.
{ "predictions": [ { "mimeType": "image/png", "prompt": "An oil painting in the style of Vincent van Gogh, depicting a raccoon adorned in a finely tailored tuxedo, complete with a crisp white shirt and a bow tie. The raccoon also sports a classic top hat, perched jauntily on its head. The painting uses thick, swirling brushstrokes characteristic of van Gogh, with vibrant hues of blue, yellow, and green in the background, contrasting with the dark tones of the raccoon's attire. The light source is subtly placed, casting a dramatic shadow of the raccoon's attire onto the surface it sits upon, further enhancing the depth and dimensionality of the composition. The overall impression is one of a whimsical and sophisticated character, a raccoon elevated to a higher class through its formal attire, rendered in van Gogh's iconic style.", "bytesBase64Encoded": "BASE64_IMG_BYTES" }, { "mimeType": "image/png", "prompt": "An oil painting in the style of Vincent van Gogh featuring a raccoon in a dapper suit, complete with a black jacket, crisp white shirt, and a black bow tie. The raccoon is wearing a black top hat, adding a touch of elegance to its ensemble. The painting is rendered with characteristic van Gogh brushwork, utilizing thick, impasto strokes of color. The background is a swirl of blues, greens, and yellows, creating a vibrant yet slightly chaotic atmosphere that contrasts with the raccoon's formal attire. The lighting is dramatic, casting sharp shadows and highlighting the textures of the fabric and the raccoon's fur, enhancing the sense of realism within the fantastical scene. The composition focuses on the raccoon's proud posture, highlighting the whimsical contrast of a wild animal dressed in formal attire, captured in the unique artistic language of van Gogh. ", "bytesBase64Encoded": "BASE64_IMG_BYTES" } ] }
Nächste Schritte
- Sprache des Text-Prompts festlegen
- Seitenverhältnis konfigurieren
- Inhalte mit einem negativen Prompt auslassen
- Deterministische Bilder generieren