Prompt-Rewriter verwenden

Bildgenerierung ausprobieren (Vertex AI Studio)

Imagen in einem Colab ausprobieren

Imagen in Vertex AI bietet ein LLM-basiertes Tool zum Umschreiben von Prompts, auch als Prompt-Rewriter bezeichnet. Mit dem Prompt-Rewriter können Sie die Qualität der generierten Bilder verbessern, indem Sie Ihrem Prompt mehr Details hinzufügen.

Wenn Sie die Funktion zum Umschreiben von Prompts deaktivieren, kann sich das auf die Qualität der Bilder und darauf auswirken, wie gut die Ausgabe dem von Ihnen angegebenen Prompt entspricht. Diese Funktion ist standardmäßig für die folgenden Modellversionen aktiviert:

  • imagen-4.0-generate-001
  • imagen-4.0-fast-generate-001
  • imagen-4.0-ultra-generate-001
  • imagen-3.0-generate-002

Der umformulierte Prompt wird nur dann in der API-Antwort zurückgegeben, wenn der ursprüngliche Prompt weniger als 30 Wörter umfasst.

Prompt-Rewriter verwenden

So verwenden Sie die Funktion zum Umschreiben von Prompts:

Konsole

  1. Rufen Sie in der Google Cloud Console die Seite Vertex AI > Media Studio auf.

    Zu Media Studio

  2. Klicken Sie auf Imagen. Die Seite zur Bildgenerierung von Imagen Media Studio wird angezeigt.

  3. Passen Sie im Bereich Einstellungen die folgenden Optionen an:

    • Modell: Wählen Sie ein Modell aus den verfügbaren Optionen aus.

      Weitere Informationen zu den verfügbaren Modellen finden Sie unter Imagen-Modelle.

    • Anzahl der Ergebnisse: Stellen Sie den Schieberegler ein oder geben Sie einen Wert zwischen 1 und 4 ein.

    • Geben Sie im Feld Negativer Prompt einen Prompt ein, der beschreibt, was nicht im Bild generiert werden soll.

  4. Klicken Sie im Feld Prompt eingeben auf Formuliere für mich.

    Das Fenster Prompt optimieren wird angezeigt.

  5. Geben Sie im Feld Aktueller Prompt Ihren Prompt ein und klicken Sie dann auf Optimieren.

    Der neu formulierte Prompt wird im Feld Optimierter Prompt angezeigt. Sie können den optimierten Prompt bearbeiten oder ihn so verwenden, wie er angezeigt wird.

  6. Klicken Sie auf Einfügen, um den angezeigten Prompt zu verwenden.

    Der Prompt wird in das Feld Geben Sie Ihren Prompt ein eingefügt.

  7. Klicken Sie auf Erstellen.

REST

Ersetzen Sie diese Werte in den folgenden Anfragedaten:

  • PROJECT_ID: Ihre Google Cloud Projekt-ID.
  • MODEL_VERSION: Die zu verwendende Modellversion für die Bildgenerierung.

    Weitere Informationen zu Modellversionen und -funktionen finden Sie unter Modellversionen.

  • LOCATION: Die Region Ihres Projekts. Beispiel: us-central1, europe-west2 oder asia-northeast3. Eine Liste der verfügbaren Regionen finden Sie unter Generative AI an Vertex AI-Standorten.
  • TEXT_PROMPT: Der Text-Prompt, der bestimmt, welche Bilder das Modell generiert. Bevor Bilder generiert werden, wird dieser Basis-Prompt mit dem LLM-basierten Tool zum Neuschreiben von Prompts mit weiteren Details und beschreibenderen Formulierungen optimiert.
  • IMAGE_COUNT: Eine Ganzzahl, die die Anzahl der zu generierenden Bilder angibt. Die zulässigen Werte sind 14. Der Standardwert ist 4.
  • PROMPT_SETTING: Ein boolescher Wert. Mit true werden erweiterte Prompts aktiviert, mit false deaktiviert. Der Standardwert ist true.

HTTP-Methode und URL:

POST https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/MODEL_VERSION:predict

JSON-Text der Anfrage:

{
  "instances": [
    {
      "prompt": "TEXT_PROMPT"
    }
  ],
  "parameters": {
    "sampleCount": IMAGE_COUNT,
    "enhancePrompt": PROMPT_SETTING
  }
}

Wenn Sie die Anfrage senden möchten, wählen Sie eine der folgenden Optionen aus:

curl

Speichern Sie den Anfragetext in einer Datei mit dem Namen request.json und führen Sie den folgenden Befehl aus:

curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/MODEL_VERSION:predict"

PowerShell

Speichern Sie den Anfragetext in einer Datei mit dem Namen request.json und führen Sie den folgenden Befehl aus:

$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }

Invoke-WebRequest `
-Method POST `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/MODEL_VERSION:predict" | Select-Object -Expand Content
Wenn die Prompt-Optimierung aktiviert ist, enthält die Antwort ein zusätzliches prompt-Feld mit dem optimierten Prompt und dem zugehörigen generierten Bild:
  {
    "predictions": [
      {
        "mimeType": "MIME_TYPE",
        "prompt": "ENHANCED_PROMPT_1",
        "bytesBase64Encoded": "BASE64_IMG_BYTES_1"
      },
      {
        "mimeType": "MIME_TYPE",
        "prompt": "ENHANCED_PROMPT_2",
        "bytesBase64Encoded": "BASE64_IMG_BYTES_2"
      }
    ]
  }

Die folgende Beispielantwort bezieht sich beispielsweise auf eine Anfrage mit "sampleCount": 2 und "prompt": "A raccoon wearing formal clothes, wearing a top hat. Oil painting in the style of Vincent Van Gogh.". Die Antwort gibt zwei Vorhersageobjekte zurück, jeweils mit dem optimierten Prompt und den generierten Bildbyte, die base64-codiert sind.

{
  "predictions": [
    {
      "mimeType": "image/png",
      "prompt": "An oil painting in the style of Vincent van Gogh,
        depicting a raccoon adorned in a finely tailored tuxedo, complete with a
        crisp white shirt and a bow tie. The raccoon also sports a classic top
        hat, perched jauntily on its head. The painting uses thick, swirling
        brushstrokes characteristic of van Gogh, with vibrant hues of blue,
        yellow, and green in the background, contrasting with the dark tones of
        the raccoon's attire. The light source is subtly placed, casting a
        dramatic shadow of the raccoon's attire onto the surface it sits upon,
        further enhancing the depth and dimensionality of the composition. The
        overall impression is one of a whimsical and sophisticated character, a
        raccoon elevated to a higher class through its formal attire, rendered
        in van Gogh's iconic style.",
      "bytesBase64Encoded": "BASE64_IMG_BYTES"
    },
    {
      "mimeType": "image/png",
      "prompt": "An oil painting in the style of Vincent van Gogh featuring
        a raccoon in a dapper suit, complete with a black jacket, crisp white
        shirt, and a black bow tie. The raccoon is wearing a black top hat,
        adding a touch of elegance to its ensemble. The painting is rendered
        with characteristic van Gogh brushwork, utilizing thick, impasto strokes
        of color. The background is a swirl of blues, greens, and yellows,
        creating a vibrant yet slightly chaotic atmosphere that contrasts with
        the raccoon's formal attire. The lighting is dramatic, casting sharp
        shadows and highlighting the textures of the fabric and the raccoon's
        fur, enhancing the sense of realism within the fantastical scene. The
        composition focuses on the raccoon's proud posture, highlighting the
        whimsical contrast of a wild animal dressed in formal attire, captured
        in the unique artistic language of van Gogh. ",
      "bytesBase64Encoded": "BASE64_IMG_BYTES"
    }
  ]
}

Nächste Schritte