Diese Seite wurde von der Cloud Translation API übersetzt.

API zur Bildgenerierung

Mit der Imagen API können Sie in Sekundenschnelle hochwertige Bilder generieren, indem Sie Text-Prompts als Anleitung für die Generierung verwenden. Sie können Bilder auch mit der Imagen API hochskalieren.

Modellkarte für Imagen für die Generierung ansehen

Unterstützte Modelle

Achtung:Ab dem 24. Juni 2025 werden Imagen-Version 1 und 2 eingestellt. Die Imagen-Modelle imagegeneration@002, imagegeneration@005 und imagegeneration@006 werden am 24. September 2025 entfernt. Weitere Informationen zur Migration zu Imagen 3 finden Sie unter Zu Imagen 3 migrieren.

Die Imagen API unterstützt die folgenden Modelle:

imagen-4.0-generate-001
imagen-4.0-fast-generate-001
imagen-4.0-ultra-generate-001
imagen-3.0-generate-002
imagen-3.0-generate-001
imagen-3.0-fast-generate-001
imagen-3.0-capability-001
imagegeneration@006
imagegeneration@005
imagegeneration@002

Weitere Informationen zu den von den einzelnen Modellen unterstützten Funktionen finden Sie unter Imagen-Modelle.

Beispielsyntax

Syntax zum Erstellen eines Bildes aus einem Text-Prompt.

Syntax

Syntax zum Generieren eines Bildes.

REST

curl -X POST \
  -H "Authorization: Bearer $(gcloud auth print-access-token)" \
  -H "Content-Type: application/json" \

https://${LOCATION}-aiplatform.googleapis.com/v1/projects/${PROJECT_ID}/locations/${LOCATION}/publishers/google/models/${MODEL_VERSION}:predict \
-d '{
  "instances": [
    {
      "prompt": "..."
    }
  ],
  "parameters": {
    "sampleCount": ...
  }
}'

Python

generation_model = ImageGenerationModel.from_pretrained("MODEL_VERSION")

response = generation_model.generate_images(
    prompt="...",
    negative_prompt="...",
    aspect_ratio=...,
)
response.images[0].show()

Bilder erstellen

REST

Parameter
`prompt`	`string` Pflichtangabe. Der Text-Prompt für das Bild.
`addWatermark`	`bool` Optional. Fügen Sie den generierten Bildern ein unsichtbares Wasserzeichen hinzu. Der Standardwert ist `true`, mit Ausnahme der folgenden Modelle: `imagegeneration@002` `imagegeneration@005`
`aspectRatio`	`string` Optional. Das Seitenverhältnis des Bildes. Der Standardwert ist "1:1".
`enhancePrompt`	`boolean` Optional. Ein optionaler Parameter, mit dem eine LLM-basierte Funktion zum Neuschreiben von Prompts verwendet werden kann, um Bilder in höherer Qualität zu liefern, die den Zweck des ursprünglichen Prompts besser widerspiegeln. Wenn Sie diese Funktion deaktivieren, kann sich das auf die Bildqualität und die Einhaltung der Vorgaben des Prompts auswirken.
`language`	`string` Optional. Der Sprachcode, der der Sprache Ihres Text-Prompts entspricht. Folgende Werte werden unterstützt: `auto`: Automatische Erkennung. Wenn Imagen eine unterstützte Sprache erkennt, werden der Prompt und ein optionaler negativer Prompt ins Englische übersetzt. Wenn die erkannte Sprache nicht unterstützt wird, verwendet Imagen den Eingabetext unverändert, was zu einer unerwarteten Ausgabe führen kann. Es wird kein Fehlercode zurückgegeben. `en`: Englisch (Standardwert, wenn nicht angegeben) `zh` oder `zh-CN`: Chinesisch (vereinfacht) `zh-TW`: Chinesisch (traditionell) `hi`: Hindi `ja`: Japanisch `ko`: Koreanisch `pt`: Portugiesisch `es`: Spanisch
`negativePrompt`	`string` Optional. Eine Beschreibung dessen, was in den generierten Bildern verhindert werden sollte. `negativePrompt` wird von `imagen-3.0-generate-002` und neueren Modellen nicht unterstützt.
`outputOptions`	`outputOptions` Optional. Beschreibt das Ausgabeformat des Bildes in einem `outputOptions`-Objekt.
`personGeneration`	`string` Optional. Das Modell darf Bilder von Personen generieren. Folgende Werte werden unterstützt: `"dont_allow"`: Personen oder Gesichter in Bildern nicht zulassen. `"allow_adult"`: Nur Generierung von Erwachsenen zulassen. `"allow_all"`: Ermöglicht die Generierung von Personen aller Altersgruppen. Der Standardwert ist `"allow_adult"`.
`safetySetting`	`string` Optional. Fügt der Sicherheitsfilterung eine Filterebene hinzu. Folgende Werte werden unterstützt: `"block_low_and_above"`: Stärkste Filterebene, strengste Blockierung. Veralteter Wert: `"block_most"`. `"block_medium_and_above"`: Einige problematische Prompts und Antworten blockieren. Veralteter Wert: `"block_some"`. `"block_only_high"`: Reduziert die Anzahl der Anfragen, die aufgrund von Sicherheitsfiltern blockiert werden. Kann dazu führen, dass Imagen mehr anstößige Inhalte generiert. Veralteter Wert: `"block_few"`. `"block_none"`: Sehr wenige problematische Prompts und Antworten blockieren. Der Zugriff auf diese Funktion ist eingeschränkt. Vorheriger Feldwert: `"block_fewest"`. Der Standardwert ist `"block_medium_and_above"`.
`sampleCount`	`int` Pflichtangabe. Die Anzahl der zu generierenden Bilder. Der Standardwert ist 4.
`sampleImageSize`	`string` Optional. Gibt die Ausgaberesolution des generierten Bildes an. Die zulässigen Werte sind `"1K"` oder `"2K"`. Der Standardwert ist `"1K"`.
`seed`	`Uint32` Optional. Der Zufalls-Seed für die Bildgenerierung. Diese Option ist nicht verfügbar, wenn `addWatermark` auf `true` festgelegt ist. Wenn `enhancePrompt` auf `true` festgelegt ist, funktioniert der Parameter `seed` nicht, da `enhancePrompt` einen neuen Prompt generiert, der zu einem neuen oder anderen Bild führt.
`storageUri`	Optional: `string` Cloud Storage-URI zum Speichern der generierten Bilder.

Objekt für Ausgabeoptionen

Das outputOptions-Objekt beschreibt die Bildausgabe.

Parameter

Parameter
`outputOptions.mimeType`	Optional: `string` Das Bildformat, in dem die Ausgabe gespeichert werden soll. Folgende Werte werden unterstützt: `"image/png"`: Als PNG-Bild speichern `"image/jpeg"`: Als JPEG-Bild speichern Der Standardwert ist `"image/png"`.
`outputOptions.compressionQuality`	Optional: `int` Der Komprimierungsgrad, wenn der Ausgabetyp `"image/jpeg"` ist. Zulässige Werte sind 0 bis 100. Der Standardwert ist 75.

outputOptions.mimeType

Optional: string

Das Bildformat, in dem die Ausgabe gespeichert werden soll. Folgende Werte werden unterstützt:

"image/png": Als PNG-Bild speichern
"image/jpeg": Als JPEG-Bild speichern

Der Standardwert ist "image/png".

outputOptions.compressionQuality

Optional: int

Der Komprimierungsgrad, wenn der Ausgabetyp "image/jpeg" ist. Zulässige Werte sind 0 bis 100. Der Standardwert ist 75.

Antwort

Der Antworttext der REST-Anfrage.

Parameter
`predictions`	Ein Array von `VisionGenerativeModelResult`-Objekten, eines für jeden angeforderten `sampleCount`. Wenn Bilder durch Responsible AI gefiltert werden, sind sie nicht enthalten, es sei denn, `includeRaiReason` ist auf `true` festgelegt.

Ergebnisobjekt des generativen Vision-Modells

Informationen zum Modellergebnis.

Parameter
`bytesBase64Encoded`	Das Base64-codierte, generierte Bild. Nicht vorhanden, wenn das Ausgabebild Filter der verantwortungsbewussten KI nicht bestanden hat.
`mimeType`	Der Typ des generierten Bildes. Nicht vorhanden, wenn das Ausgabebild Filter der verantwortungsbewussten KI nicht bestanden hat.
`raiFilteredReason`	Der Grund für den Filter der verantwortungsbewussten KI. Wird nur zurückgegeben, wenn `includeRaiReason` aktiviert ist und dieses Bild herausgefiltert wurde.
`safetyAttributes.categories`	Der Name des Sicherheitsattributs. Wird nur zurückgegeben, wenn `includeSafetyAttributes` aktiviert ist und das Ausgabebild Filter der verantwortungsbewussten KI bestanden hat.
`safetyAttributes.scores`	Die Punktzahl für das Sicherheitsattribut. Wird nur zurückgegeben, wenn `includeSafetyAttributes` aktiviert ist und das Ausgabebild Filter der verantwortungsbewussten KI bestanden hat.

Python

Parameter
`prompt`	`string` Pflichtangabe. Der Text-Prompt für das Bild.
`add_watermark`	`bool` Optional. Fügen Sie dem generierten Bild ein Wasserzeichen hinzu. Der Standardwert ist `true`, mit Ausnahme der folgenden Modelle: `imagegeneration@002` `imagegeneration@005`
`aspect_ratio`	`string` Optional. Das Seitenverhältnis des Bildes. Der Standardwert ist „1:1“.
`compression_quality`	`int` Optional. Der Komprimierungsgrad, wenn der MIME-Typ der Ausgabe `"image/jpeg"` ist. Der Standardwert ist 75.
`language`	`string` Optional. Die Sprache des Text-Prompts für das Bild. Folgende Werte werden unterstützt: `auto`: Automatische Erkennung. Wenn Imagen eine unterstützte Sprache erkennt, werden der Prompt und ein optionaler negativer Prompt ins Englische übersetzt. Wenn die erkannte Sprache nicht unterstützt wird, verwendet Imagen den Eingabetext unverändert, was zu einer unerwarteten Ausgabe führen kann. Es wird kein Fehlercode zurückgegeben. `en`: Englisch (Standardwert, wenn nicht angegeben) `zh` oder `zh-CN`: Chinesisch (vereinfacht) `zh-TW`: Chinesisch (traditionell) `hi`: Hindi `ja`: Japanisch `ko`: Koreanisch `pt`: Portugiesisch `es`: Spanisch Der Standardwert ist `"auto"`.
`negative_prompt`	`string` Optional. Eine Beschreibung dessen, was in den generierten Bildern verhindert werden sollte. `negative_prompt` wird von `imagen-3.0-generate-002` und neueren Modellen nicht unterstützt.
`number_of_images`	`int` Pflichtangabe. Die Anzahl der zu generierenden Bilder. Der Standardwert ist 1.
`output_gcs_uri`	`string` Optional. Cloud Storage-URI zum Speichern der generierten Bilder.
`output_mime_type`	`string` Optional. Das Bildformat, in dem die Ausgabe gespeichert werden soll. Folgende Werte werden unterstützt: `"image/png"`: Als PNG-Bild speichern `"image/jpeg"`: Als JPEG-Bild speichern Der Standardwert ist `"image/png"`.
`person_generation`	`string` Optional. Das Modell darf Bilder von Personen generieren. Folgende Werte werden unterstützt: `"dont_allow"`: Generierung von Personen blockieren `"allow_adult"`: Erwachsene, aber keine Kinder generieren `"allow_all"`: Erwachsene und Kinder generieren Der Standardwert ist `"allow_adult"`.
`safety_filter_level`	`string` Optional. Fügt der Sicherheitsfilterung eine Filterebene hinzu. Folgende Werte werden unterstützt: `"block_low_and_above"`: Die stärkste Filterebene, die zu der strengsten Blockierung führt. Veralteter Wert: `"block_most"`. `"block_medium_and_above"`: Einige problematische Prompts und Antworten blockieren. Veralteter Wert: `"block_some"`. `"block_only_high"`: Weniger problematische Prompts und Antworten blockieren. Veralteter Wert: `"block_few"`. `"block_none"`: Sehr wenige problematische Prompts und Antworten blockieren. Veralteter Wert: `"block_fewest"`. Der Standardwert ist `"block_medium_and_above"`.
`sample_image_size`	`string` Optional. Gibt die Ausgaberesolution des generierten Bildes an. Die zulässigen Werte sind `"1K"` oder `"2K"`. Der Standardwert ist `"1K"`.
`seed`	`int` Optional. Der Zufalls-Seed für die Bildgenerierung. Diese Option ist nicht verfügbar, wenn `addWatermark` auf `true` festgelegt ist. Wenn `enhancePrompt` auf `true` festgelegt ist, funktioniert `seed` nicht, da `enhancePrompt` einen neuen Prompt generiert, der zu einem neuen oder anderen Bild führt.

Auflösung von Bildern erhöhen

REST

Parameter
`mode`	`string` Pflichtangabe. Muss für Upscaling-Anfragen auf `"upscale"` festgelegt werden.
`upscaleConfig`	`UpscaleConfig` Pflichtangabe. Ein `UpscaleConfig`-Objekt.
`outputOptions`	`OutputOptions` Optional. Beschreibt das Ausgabeformat des Bildes in einem `outputOptions`-Objekt.
`storageUri`	`string` Optional. Cloud Storage-URI, unter dem die generierten Bilder gespeichert werden sollen.

Hochskalierungs-Konfigurationsobjekt

Parameter

Parameter
`upscaleConfig.upscaleFactor`	`string` Pflichtangabe. Der Hochskalierungsfaktor. Die unterstützten Werte sind `"x2"` und `"x4"`.

upscaleConfig.upscaleFactor

string

Pflichtangabe. Der Hochskalierungsfaktor. Die unterstützten Werte sind "x2" und "x4".

Antwort

Der Antworttext der REST-Anfrage.

Parameter
`predictions`	Ein Array von `VisionGenerativeModelResult`-Objekten, eines für jeden angeforderten `sampleCount`. Wenn Bilder durch Responsible AI gefiltert werden, sind sie nicht enthalten, es sei denn, `includeRaiReason` ist auf `true` festgelegt.

Beispiele

In den folgenden Beispielen wird gezeigt, wie Sie mit den Imagen-Modellen Bilder generieren.

Bilder erstellen

REST

Ersetzen Sie diese Werte in den folgenden Anfragedaten:

PROJECT_ID: Ihre Google Cloud Projekt-ID.
MODEL_VERSION: Die zu verwendende Imagen-Modellversion. Weitere Informationen zu den verfügbaren Modellen finden Sie unter Imagen-Modelle.
LOCATION: Die Region Ihres Projekts. Beispiel: us-central1, europe-west2 oder asia-northeast3. Eine Liste der verfügbaren Regionen finden Sie unter Generative AI an Vertex AI-Standorten.
TEXT_PROMPT: Der Text-Prompt, der bestimmt, welche Bilder das Modell generiert. Dieses Feld ist sowohl zum Erstellen als auch zum Bearbeiten erforderlich.
IMAGE_COUNT ist die Anzahl der generierten Bilder. Zulässige Ganzzahlwerte: 1–8 (imagegeneration@002), 1–4 (alle anderen Modellversionen). Standardwert: 4

Zusätzliche optionale Parameter

Je nach Anwendungsfall können Sie die folgenden optionalen Variablen verwenden. Fügen Sie dem "parameters": {}-Objekt einige oder alle der folgenden Parameter hinzu. Diese Liste enthält häufig verwendete optionale Parameter und erhebt keinen Anspruch auf Vollständigkeit. Weitere Informationen zu optionalen Parametern finden Sie in der Imagen API-Referenz: Bilder generieren.

"parameters": {
  "sampleCount": IMAGE_COUNT,
  "addWatermark": ADD_WATERMARK,
  "aspectRatio": "ASPECT_RATIO",
  "enhancePrompt": ENABLE_PROMPT_REWRITING,
  "includeRaiReason": INCLUDE_RAI_REASON,
  "includeSafetyAttributes": INCLUDE_SAFETY_ATTRIBUTES,
  "outputOptions": {
    "mimeType": "MIME_TYPE",
    "compressionQuality": COMPRESSION_QUALITY
  },
  "personGeneration": "PERSON_SETTING",
  "safetySetting": "SAFETY_SETTING",
  "seed": SEED_NUMBER,
  "storageUri": "OUTPUT_STORAGE_URI"
}

ADD_WATERMARK: boolesch. Optional. Gibt an, ob für generierte Bilder ein Wasserzeichen aktiviert werden soll. Alle Bilder, die generiert werden, wenn das Feld auf true gesetzt ist, enthalten eine digitale SynthID, mit der Sie ein Bild mit Wasserzeichen überprüfen können. Wenn Sie dieses Feld weglassen, wird der Standardwert true verwendet. Sie müssen den Wert auf false festlegen, um diese Funktion zu deaktivieren. Sie können das Feld seed verwenden, um deterministische Ausgaben zu erhalten. Dies ist jedoch nur möglich, wenn dieses Feld auf false gesetzt ist.
ASPECT_RATIO: String. Optional. Ein Parameter für den Generierungsmodus, der das Seitenverhältnis steuert. Unterstützte Verhältniswerte und ihre beabsichtigte Verwendung:
- 1:1 (Standard, Quadrat)
- 3:4 (Anzeigen, soziale Medien)
- 4:3 (Fernsehen, Fotografie)
- 16:9 (Querformat)
- 9:16 Hochformat
ENABLE_PROMPT_REWRITING: boolesch. Optional. Ein Parameter, mit dem eine LLM-basierte Funktion zum Neuschreiben von Prompts verwendet werden kann, um Bilder in höherer Qualität zu liefern, die den Zweck des ursprünglichen Prompts besser widerspiegeln. Wenn Sie diese Funktion deaktivieren, kann sich das auf die Bildqualität und die Einhaltung der Vorgaben des Prompts auswirken. Standardwert: true.
INCLUDE_RAI_REASON: boolesch. Optional. Gibt an, ob der von der verantwortungsbewussten KI gefilterte Grundcode in Antworten mit blockierter Eingabe oder Ausgabe aktiviert sein soll. Standardwert: true.
INCLUDE_SAFETY_ATTRIBUTES: boolesch. Optional. Gibt an, ob gerundete Werte der verantwortungsbewussten KI für eine Liste von Sicherheitsattributen in Antworten für ungefilterte Eingabe und Ausgabe aktiviert werden sollen. Kategorien für Sicherheitsattribute: "Death, Harm & Tragedy", "Firearms & Weapons", "Hate", "Health", "Illicit Drugs", "Politics", "Porn", "Religion & Belief","Toxic", "Violence", "Vulgarity", "War & Conflict". Standardwert: false.
MIME_TYPE: String. Optional. Der MIME-Typ des Bildinhalts. Verfügbare Werte:
- image/jpeg
- image/gif
- image/png
- image/webp
- image/bmp
- image/tiff
- image/vnd.microsoft.icon
COMPRESSION_QUALITY: integer. Optional. Gilt nur für JPEG-Ausgabedateien. Der Detaillierungsgrad, den das Modell für Bilder im JPEG-Dateiformat beibehält. Werte: 0 bis 100, wobei eine höhere Zahl eine stärkere Komprimierung bedeutet. Standard: 75.
PERSON_SETTING: String. Optional. Die Sicherheitseinstellung, die bestimmt, welche Art von Personen- oder Gesichtererstellung das Modell zulässt. Verfügbare Werte:
- allow_adult (Standard): Es dürfen nur Erwachsene generiert werden, mit Ausnahme von Prominenten. Die Generierung von Prominenten ist in keiner Einstellung zulässig.
- dont_allow: Personen oder Gesichter in generierten Bildern nicht zulassen.
SAFETY_SETTING: String. Optional. Eine Einstellung, mit der die Grenzwerte für Sicherheitsfilter für generierte Bilder gesteuert werden. Verfügbare Werte:
- block_low_and_above: Der höchste Sicherheitsgrenzwert, der dazu führt, dass die meisten generierten Bilder gefiltert werden. Vorheriger Wert: block_most.
- block_medium_and_above (Standardeinstellung): Ein mittlerer Sicherheitsgrenzwert, der potenziell schädliche und sichere Inhalte ausgeglichen behandelt. Vorheriger Wert: block_some.
- block_only_high: Ein Sicherheitsgrenzwert, der die Anzahl der Anfragen reduziert, die aufgrund von Sicherheitsfiltern blockiert werden. Diese Einstellung kann dazu führen, dass Imagen mehr anstößige Inhalte generiert. Vorheriger Wert: block_few.
SEED_NUMBER: integer. Optional. Jede nicht negative Ganzzahl, die Sie angeben, um Ausgabebilder deterministisch zu machen. Die Angabe derselben Quell-Nummer führt immer zu denselben Ausgabebildern. Wenn das von Ihnen verwendete Modell digitales Wasserzeichen unterstützt, müssen Sie "addWatermark": false festlegen, um dieses Feld zu verwenden. Zulässige Ganzzahlwerte: 1–2147483647.
OUTPUT_STORAGE_URI: String. Optional. Der Cloud Storage-Bucket, in dem die Ausgabebilder gespeichert werden sollen. Wenn nicht angegeben, werden base64-codierte Bildbyte in der Antwort zurückgegeben. Beispielwert: gs://image-bucket/output/.

HTTP-Methode und URL:

POST https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/MODEL_VERSION:predict

JSON-Text der Anfrage:

{
  "instances": [
    {
      "prompt": "TEXT_PROMPT"
    }
  ],
  "parameters": {
    "sampleCount": IMAGE_COUNT
  }
}

Wenn Sie die Anfrage senden möchten, wählen Sie eine der folgenden Optionen aus:

curl

Hinweis: Der folgende Befehl setzt voraus, dass Sie sich mit Ihrem Nutzerkonto bei der gcloud CLI angemeldet haben. Dazu haben Sie gcloud init oder gcloud auth login ausgeführt oder die Cloud Shell genutzt, die Sie automatisch bei der gcloud CLI anmeldet. Um herauszufinden, welches Konto gerade aktiv ist, führen Sie gcloud auth list aus.

Speichern Sie den Anfragetext in einer Datei mit dem Namen request.json und führen Sie den folgenden Befehl aus:

curl -X POST \
     -H "Authorization: Bearer $(gcloud auth print-access-token)" \
     -H "Content-Type: application/json; charset=utf-8" \
     -d @request.json \
     "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/MODEL_VERSION:predict"

PowerShell

Hinweis: Der folgende Befehl setzt voraus, dass Sie sich mit Ihrem Nutzerkonto bei der gcloud CLI angemeldet haben. Dazu führen Sie gcloud init oder gcloud auth login aus. Um herauszufinden, welches Konto gerade aktiv ist, führen Sie gcloud auth list aus.

Speichern Sie den Anfragetext in einer Datei mit dem Namen request.json und führen Sie den folgenden Befehl aus:

$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }

Invoke-WebRequest `
    -Method POST `
    -Headers $headers `
    -ContentType: "application/json; charset=utf-8" `
    -InFile request.json `
    -Uri "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/MODEL_VERSION:predict" | Select-Object -Expand Content

Die folgende Beispielantwort bezieht sich auf eine Anfrage mit

"sampleCount":
  2

. Die Antwort gibt zwei Vorhersageobjekte zurück, wobei die generierten Bildbyte base64-codiert sind.

{
  "predictions": [
    {
      "bytesBase64Encoded": "BASE64_IMG_BYTES",
      "mimeType": "image/png"
    },
    {
      "mimeType": "image/png",
      "bytesBase64Encoded": "BASE64_IMG_BYTES"
    }
  ]
}

Wenn Sie ein Modell verwenden, das die Prompt-Optimierung unterstützt, enthält die Antwort ein zusätzliches prompt-Feld mit dem optimierten Prompt, der für die Generierung verwendet wurde:

{
  "predictions": [
    {
      "mimeType": "MIME_TYPE",
      "prompt": "ENHANCED_PROMPT_1",
      "bytesBase64Encoded": "BASE64_IMG_BYTES_1"
    },
    {
      "mimeType": "MIME_TYPE",
      "prompt": "ENHANCED_PROMPT_2",
      "bytesBase64Encoded": "BASE64_IMG_BYTES_2"
    }
  ]
}

Python

Bevor Sie dieses Beispiel anwenden, folgen Sie den Python-Einrichtungsschritten in der Vertex AI-Kurzanleitung zur Verwendung von Clientbibliotheken. Weitere Informationen finden Sie in der Referenzdokumentation zur Vertex AI Python API.

Richten Sie zur Authentifizierung bei Vertex AI Standardanmeldedaten für Anwendungen ein. Weitere Informationen finden Sie unter Authentifizierung für eine lokale Entwicklungsumgebung einrichten.

In diesem Beispiel rufen Sie die Methode generate_images in der ImageGenerationModel (@006-Version) auf und speichern die generierten Bilder lokal. Anschließend können Sie optional die Methode show() in einem Notebook verwenden, um die generierten Images anzuzeigen. Weitere Informationen zu Modellversionen und -features finden Sie unter Modellversionen.


import vertexai
from vertexai.preview.vision_models import ImageGenerationModel

# TODO(developer): Update and un-comment below lines
# PROJECT_ID = "your-project-id"
# output_file = "input-image.png"
# prompt = "" # The text prompt describing what you want to see.

vertexai.init(project=PROJECT_ID, location="us-central1")

model = ImageGenerationModel.from_pretrained("imagen-3.0-generate-002")

images = model.generate_images(
    prompt=prompt,
    # Optional parameters
    number_of_images=1,
    language="en",
    # You can't use a seed value and watermark at the same time.
    # add_watermark=False,
    # seed=100,
    aspect_ratio="1:1",
    safety_filter_level="block_some",
    person_generation="allow_adult",
)

images[0].save(location=output_file, include_generation_parameters=False)

# Optional. View the generated image in a notebook.
# images[0].show()

print(f"Created output image using {len(images[0]._image_bytes)} bytes")
# Example response:
# Created output image using 1234567 bytes

Auflösung von Bildern erhöhen

REST

Ersetzen Sie diese Werte in den folgenden Anfragedaten:

LOCATION: Die Region Ihres Projekts. Beispiel: us-central1, europe-west2 oder asia-northeast3. Eine Liste der verfügbaren Regionen finden Sie unter Generative AI an Vertex AI-Standorten.
PROJECT_ID: Ihre Google Cloud Projekt-ID.
B64_BASE_IMAGE: Das Basisbild, das bearbeitet oder hochskaliert werden soll. Das Bild muss als base64-codierter Bytestring angegeben werden. Größenbeschränkung: 10 MB.
IMAGE_SOURCE: Der Cloud Storage-Speicherort des Bildes, das Sie bearbeiten oder hochskalieren möchten. Beispiel: gs://output-bucket/source-photos/photo.png
UPSCALE_FACTOR: Optional. Der Faktor, auf den das Bild hochskaliert werden soll. Wenn nicht angegeben, wird der Hochskalierungsfaktor von der längeren Seite des Eingabebilds und von sampleImageSize bestimmt. Verfügbare Werte: x2 oder x4.

HTTP-Methode und URL:

POST https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/imagegeneration@002:predict

JSON-Text der Anfrage:

{
  "instances": [
    {
      "prompt": "",
      "image": {
        // use one of the following to specify the image to upscale
        "bytesBase64Encoded": "B64_BASE_IMAGE"
        "gcsUri": "IMAGE_SOURCE"
        // end of base image input options
      },
    }
  ],
  "parameters": {
    "sampleCount": 1,
    "mode": "upscale",
    "upscaleConfig": {
      "upscaleFactor": "UPSCALE_FACTOR"
    }
  }
}

Wenn Sie die Anfrage senden möchten, wählen Sie eine der folgenden Optionen aus:

curl

Speichern Sie den Anfragetext in einer Datei mit dem Namen request.json und führen Sie den folgenden Befehl aus:

curl -X POST \
     -H "Authorization: Bearer $(gcloud auth print-access-token)" \
     -H "Content-Type: application/json; charset=utf-8" \
     -d @request.json \
     "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/imagegeneration@002:predict"

PowerShell

Speichern Sie den Anfragetext in einer Datei mit dem Namen request.json und führen Sie den folgenden Befehl aus:

$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }

Invoke-WebRequest `
    -Method POST `
    -Headers $headers `
    -ContentType: "application/json; charset=utf-8" `
    -InFile request.json `
    -Uri "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/imagegeneration@002:predict" | Select-Object -Expand Content

Sie sollten in etwa folgende JSON-Antwort erhalten:

{
  "predictions": [
    {
      "mimeType": "image/png",
      "bytesBase64Encoded": "iVBOR..[base64-encoded-upscaled-image]...YII="
    }
  ]
}

Nächste Schritte

Weitere Informationen finden Sie in der Übersicht zu Imagen in Vertex AI und unter Bilder mit Text-Prompts erstellen.

Zurück

Bilder mithilfe von Text-Prompts erstellen

API zur Bildgenerierung Mit Sammlungen den Überblick behalten Sie können Inhalte basierend auf Ihren Einstellungen speichern und kategorisieren.

Unterstützte Modelle

Beispielsyntax

Syntax

REST

Python

Bilder erstellen

REST

Objekt für Ausgabeoptionen

Antwort

Ergebnisobjekt des generativen Vision-Modells

Python

Auflösung von Bildern erhöhen

REST

Hochskalierungs-Konfigurationsobjekt

Antwort

Beispiele

Bilder erstellen

REST

curl

PowerShell

Python

Auflösung von Bildern erhöhen

REST

curl

PowerShell

Nächste Schritte

API zur Bildgenerierung