Diese Seite wurde von der Cloud Translation API übersetzt.

Seitenverhältnis konfigurieren

Achtung:Ab dem 24. Juni 2025 werden Imagen-Version 1 und 2 eingestellt. Die Imagen-Modelle imagegeneration@002, imagegeneration@005 und imagegeneration@006 werden am 24. September 2025 entfernt. Weitere Informationen zur Migration zu Imagen 3 finden Sie unter Zu Imagen 3 migrieren.

Bildgenerierung ausprobieren (Vertex AI Studio)

Imagen in einem Colab ausprobieren

Auf dieser Seite wird beschrieben, wie Sie das Seitenverhältnis konfigurieren, für das Imagen in Vertex AI Bilder generiert.

Je nachdem, wie Sie die generierten Bilder verwenden möchten, sind einige Seitenverhältnisse möglicherweise besser geeignet als andere. Wählen Sie das Seitenverhältnis aus, das am besten zu Ihrem Anwendungsfall passt.

Es gibt mehrere Modelle zur Bildgenerierung, die Sie verwenden können. Bestimmte Seitenverhältnisse sind für bestimmte Imagen-Modelle verfügbar. Weitere Informationen finden Sie unter Imagen-Modelle.

Seitenverhältnis	Verwendungszweck	Beispielbild
`1:1`	Standard, quadratisch, allgemeine Verwendung	^{Eingabeaufforderung: Luftaufnahme eines Pasta-Dinners, Studiofoto im Stil des Food-Magazincovers.}
`3:4`	TV, Medien, Film	^{Prompt: Kommerzielle Fotoaufnahme, Duftanzeige, Duftflasche mit Lavendel-Vanille auf einem hellen Hintergrund.}
`4:3`	TV, Medien, Film	^{Prompt: Kommerzielle Fotoaufnahme, grüne und graue High-Top-Sneaker, 4-k, dramatische Winkel}
`9:16`	Hochformat, hohe Objekte, Mobilgeräte	^{Prompt: Naturfoto, ein Strand auf Hawaii mit dem Meer im Hintergrund, Lichtreflexion, Sonnenuntergang.}
`16:9`	Landschaft	^{Prompt: Wolkenkratzer in New York City, futuristisches Rendering, Konzept, digitale Kunst}

Konsole

Rufen Sie in der Google Cloud Console die Seite Vertex AI > Media Studio auf.

Zu Media Studio
Klicken Sie auf Imagen. Die Seite zur Bildgenerierung von Imagen Media Studio wird angezeigt.
Passen Sie im Bereich Einstellungen die folgenden Optionen an:
- Modell: Wählen Sie ein Modell aus den verfügbaren Optionen aus.
  
  Weitere Informationen zu den verfügbaren Modellen finden Sie unter Imagen-Modelle.
- Seitenverhältnis: Das Seitenverhältnis, das beim Generieren von Bildern verwendet werden soll
Geben Sie im Feld Prompt schreiben Ihren Textprompt ein, der die zu generierenden Bilder beschreibt. Beispiel: Kleines Boot auf dem Wasser am Morgen, Wasserfarben, Illustration.
Klicken Sie auf Erstellen.

REST

Das Seitenverhältnis ist ein optionales Feld im parameters-Objekt eines JSON-Anfragetexts.

Ersetzen Sie diese Werte in den folgenden Anfragedaten:

PROJECT_ID: Ihre Google Cloud Projekt-ID.
MODEL_VERSION: Die zu verwendende Imagen-Modellversion. Weitere Informationen zu den verfügbaren Modellen finden Sie unter Imagen-Modelle.
LOCATION: Die Region Ihres Projekts. Beispiel: us-central1, europe-west2 oder asia-northeast3. Eine Liste der verfügbaren Regionen finden Sie unter Generative AI an Vertex AI-Standorten.
TEXT_PROMPT: Der Text-Prompt, der bestimmt, welche Bilder das Modell generiert. Dieses Feld ist sowohl zum Erstellen als auch zum Bearbeiten erforderlich.
IMAGE_COUNT ist die Anzahl der generierten Bilder. Zulässige Ganzzahlwerte: 1–8 (imagegeneration@002), 1–4 (alle anderen Modellversionen). Standardwert: 4

Zusätzliche optionale Parameter

Je nach Anwendungsfall können Sie die folgenden optionalen Variablen verwenden. Fügen Sie dem "parameters": {}-Objekt einige oder alle der folgenden Parameter hinzu. Diese Liste enthält häufig verwendete optionale Parameter und erhebt keinen Anspruch auf Vollständigkeit. Weitere Informationen zu optionalen Parametern finden Sie in der Imagen API-Referenz: Bilder generieren.

"parameters": {
  "sampleCount": IMAGE_COUNT,
  "addWatermark": ADD_WATERMARK,
  "aspectRatio": "ASPECT_RATIO",
  "enhancePrompt": ENABLE_PROMPT_REWRITING,
  "includeRaiReason": INCLUDE_RAI_REASON,
  "includeSafetyAttributes": INCLUDE_SAFETY_ATTRIBUTES,
  "outputOptions": {
    "mimeType": "MIME_TYPE",
    "compressionQuality": COMPRESSION_QUALITY
  },
  "personGeneration": "PERSON_SETTING",
  "safetySetting": "SAFETY_SETTING",
  "seed": SEED_NUMBER,
  "storageUri": "OUTPUT_STORAGE_URI"
}

ADD_WATERMARK: boolesch. Optional. Gibt an, ob für generierte Bilder ein Wasserzeichen aktiviert werden soll. Alle Bilder, die generiert werden, wenn das Feld auf true gesetzt ist, enthalten eine digitale SynthID, mit der Sie ein Bild mit Wasserzeichen überprüfen können. Wenn Sie dieses Feld weglassen, wird der Standardwert true verwendet. Sie müssen den Wert auf false festlegen, um diese Funktion zu deaktivieren. Sie können das Feld seed verwenden, um deterministische Ausgaben zu erhalten. Dies ist jedoch nur möglich, wenn dieses Feld auf false gesetzt ist.
ASPECT_RATIO: String. Optional. Ein Parameter für den Generierungsmodus, der das Seitenverhältnis steuert. Unterstützte Verhältniswerte und ihre beabsichtigte Verwendung:
- 1:1 (Standard, Quadrat)
- 3:4 (Anzeigen, soziale Medien)
- 4:3 (Fernsehen, Fotografie)
- 16:9 (Querformat)
- 9:16 Hochformat
ENABLE_PROMPT_REWRITING: boolesch. Optional. Ein Parameter, mit dem eine LLM-basierte Funktion zum Neuschreiben von Prompts verwendet werden kann, um Bilder in höherer Qualität zu liefern, die den Zweck des ursprünglichen Prompts besser widerspiegeln. Wenn Sie diese Funktion deaktivieren, kann sich das auf die Bildqualität und die Einhaltung der Vorgaben des Prompts auswirken. Standardwert: true.
INCLUDE_RAI_REASON: boolesch. Optional. Gibt an, ob der von der verantwortungsbewussten KI gefilterte Grundcode in Antworten mit blockierter Eingabe oder Ausgabe aktiviert sein soll. Standardwert: true.
INCLUDE_SAFETY_ATTRIBUTES: boolesch. Optional. Gibt an, ob gerundete Werte der verantwortungsbewussten KI für eine Liste von Sicherheitsattributen in Antworten für ungefilterte Eingabe und Ausgabe aktiviert werden sollen. Kategorien für Sicherheitsattribute: "Death, Harm & Tragedy", "Firearms & Weapons", "Hate", "Health", "Illicit Drugs", "Politics", "Porn", "Religion & Belief","Toxic", "Violence", "Vulgarity", "War & Conflict". Standardwert: false.
MIME_TYPE: String. Optional. Der MIME-Typ des Bildinhalts. Verfügbare Werte:
- image/jpeg
- image/gif
- image/png
- image/webp
- image/bmp
- image/tiff
- image/vnd.microsoft.icon
COMPRESSION_QUALITY: integer. Optional. Gilt nur für JPEG-Ausgabedateien. Der Detaillierungsgrad, den das Modell für Bilder im JPEG-Dateiformat beibehält. Werte: 0 bis 100, wobei eine höhere Zahl eine stärkere Komprimierung bedeutet. Standard: 75.
PERSON_SETTING: String. Optional. Die Sicherheitseinstellung, die bestimmt, welche Art von Personen- oder Gesichtererstellung das Modell zulässt. Verfügbare Werte:
- allow_adult (Standard): Es dürfen nur Erwachsene generiert werden, mit Ausnahme von Prominenten. Die Generierung von Prominenten ist in keiner Einstellung zulässig.
- dont_allow: Personen oder Gesichter in generierten Bildern nicht zulassen.
SAFETY_SETTING: String. Optional. Eine Einstellung, mit der die Grenzwerte für Sicherheitsfilter für generierte Bilder gesteuert werden. Verfügbare Werte:
- block_low_and_above: Der höchste Sicherheitsgrenzwert, der dazu führt, dass die meisten generierten Bilder gefiltert werden. Vorheriger Wert: block_most.
- block_medium_and_above (Standardeinstellung): Ein mittlerer Sicherheitsgrenzwert, der potenziell schädliche und sichere Inhalte ausgeglichen behandelt. Vorheriger Wert: block_some.
- block_only_high: Ein Sicherheitsgrenzwert, der die Anzahl der Anfragen reduziert, die aufgrund von Sicherheitsfiltern blockiert werden. Diese Einstellung kann dazu führen, dass Imagen mehr anstößige Inhalte generiert. Vorheriger Wert: block_few.
SEED_NUMBER: integer. Optional. Jede nicht negative Ganzzahl, die Sie angeben, um Ausgabebilder deterministisch zu machen. Die Angabe derselben Quell-Nummer führt immer zu denselben Ausgabebildern. Wenn das von Ihnen verwendete Modell digitales Wasserzeichen unterstützt, müssen Sie "addWatermark": false festlegen, um dieses Feld zu verwenden. Zulässige Ganzzahlwerte: 1–2147483647.
OUTPUT_STORAGE_URI: String. Optional. Der Cloud Storage-Bucket, in dem die Ausgabebilder gespeichert werden sollen. Wenn nicht angegeben, werden base64-codierte Bildbyte in der Antwort zurückgegeben. Beispielwert: gs://image-bucket/output/.

HTTP-Methode und URL:

POST https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/MODEL_VERSION:predict

JSON-Text der Anfrage:

{
  "instances": [
    {
      "prompt": "TEXT_PROMPT"
    }
  ],
  "parameters": {
    "sampleCount": IMAGE_COUNT
  }
}

Wenn Sie die Anfrage senden möchten, wählen Sie eine der folgenden Optionen aus:

curl

Hinweis: Der folgende Befehl setzt voraus, dass Sie sich mit Ihrem Nutzerkonto bei der gcloud CLI angemeldet haben. Dazu haben Sie gcloud init oder gcloud auth login ausgeführt oder die Cloud Shell genutzt, die Sie automatisch bei der gcloud CLI anmeldet. Um herauszufinden, welches Konto gerade aktiv ist, führen Sie gcloud auth list aus.

Speichern Sie den Anfragetext in einer Datei mit dem Namen request.json und führen Sie den folgenden Befehl aus:

curl -X POST \
     -H "Authorization: Bearer $(gcloud auth print-access-token)" \
     -H "Content-Type: application/json; charset=utf-8" \
     -d @request.json \
     "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/MODEL_VERSION:predict"

PowerShell

Hinweis: Der folgende Befehl setzt voraus, dass Sie sich mit Ihrem Nutzerkonto bei der gcloud CLI angemeldet haben. Dazu führen Sie gcloud init oder gcloud auth login aus. Um herauszufinden, welches Konto gerade aktiv ist, führen Sie gcloud auth list aus.

Speichern Sie den Anfragetext in einer Datei mit dem Namen request.json und führen Sie den folgenden Befehl aus:

$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }

Invoke-WebRequest `
    -Method POST `
    -Headers $headers `
    -ContentType: "application/json; charset=utf-8" `
    -InFile request.json `
    -Uri "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/MODEL_VERSION:predict" | Select-Object -Expand Content

Die folgende Beispielantwort bezieht sich auf eine Anfrage mit

"sampleCount":
  2

. Die Antwort gibt zwei Vorhersageobjekte zurück, wobei die generierten Bildbyte base64-codiert sind.

{
  "predictions": [
    {
      "bytesBase64Encoded": "BASE64_IMG_BYTES",
      "mimeType": "image/png"
    },
    {
      "mimeType": "image/png",
      "bytesBase64Encoded": "BASE64_IMG_BYTES"
    }
  ]
}

Wenn Sie ein Modell verwenden, das die Prompt-Optimierung unterstützt, enthält die Antwort ein zusätzliches prompt-Feld mit dem optimierten Prompt, der für die Generierung verwendet wurde:

{
  "predictions": [
    {
      "mimeType": "MIME_TYPE",
      "prompt": "ENHANCED_PROMPT_1",
      "bytesBase64Encoded": "BASE64_IMG_BYTES_1"
    },
    {
      "mimeType": "MIME_TYPE",
      "prompt": "ENHANCED_PROMPT_2",
      "bytesBase64Encoded": "BASE64_IMG_BYTES_2"
    }
  ]
}

Seitenverhältnis konfigurieren Mit Sammlungen den Überblick behalten Sie können Inhalte basierend auf Ihren Einstellungen speichern und kategorisieren.

Konsole

REST

curl

PowerShell

Nächste Schritte

Seitenverhältnis konfigurieren