Diese Seite wurde von der Cloud Translation API übersetzt.

Bilder mithilfe von Text-Prompts erstellen

Sie können Imagen in Vertex AI verwenden, um neue Bilder aus einer Texteingabe zu generieren, die Sie in der Google Cloud Console angeben oder in einer Anfrage an die Vertex AI API senden.

Weitere Informationen zum Schreiben von Prompts zur Bilderstellung und -bearbeitung finden Sie im Leitfaden zu Prompts.

Modellkarte „Imagen für die Bildgenerierung“ aufrufen

Bildgenerierung ausprobieren (Vertex AI Studio)

Standorte

Ein Standort ist eine Region, die Sie in einer Anfrage angeben können, um zu steuern, wo Daten im Ruhezustand gespeichert werden. Eine Liste der verfügbaren Regionen finden Sie unter Generative AI an Vertex AI-Standorten.

Sicherheitsfilter

Sowohl Eingabedaten als auch Ausgabeinhalte werden auf anstößige Inhalte geprüft, wenn Sie eine Anfrage zur Bildgenerierung an Imagen senden. Das bedeutet, dass anstößige Eingaben für Textprompts blockiert werden können. Ähnlich können anstößige Ausgabebilder blockiert werden, was sich auf die Anzahl der generierten Bilder auswirkt, die Sie in einer Antwort erhalten.

Weitere Informationen zu Sicherheitsfiltern und der Verarbeitung blockierter Inhalte finden Sie unter Verantwortungsbewusste KI und Nutzungsrichtlinien für Google Bilder.

Leistung und Einschränkungen

Die folgenden Limits gelten, wenn Sie ein Imagen-Modell für die Bildgenerierung verwenden:

Limits	Wert (Imagen 3)
Maximale Anzahl an API-Anfragen pro Minute und Projekt	Imagen 3: 20 Imagen 3 Fast: 200
Maximale Anzahl an Bildern, die pro Anfrage zurückgegeben werden (Text-zu-Bild-Generierung)	4
Maximale Bildgröße, die in einer Anfrage hochgeladen oder gesendet wird (MB)	10 MB
Unterstützte zurückgegebene Bildauflösung (Pixel)	1.024 × 1.024 Pixel (Seitenverhältnis 1:1) 896 × 1280 (Seitenverhältnis 3:4) 1280 x 896 (Seitenverhältnis 4:3) 768 × 1408 (Seitenverhältnis 9:16) 1408 × 768 (Seitenverhältnis 16:9)
Maximale Anzahl von Eingabetokens (Text-zu-Bild-Generierung – Prompttext)	480 Tokens

Modellversionen

Es gibt verschiedene Versionen des Modells zur Bildgenerierung, die Sie verwenden können. Allgemeine Informationen zur Versionsverwaltung von Imagen-Modellen finden Sie unter Imagen-Modelle und Lebenszyklus.

Die folgenden Modelle und die zugehörigen Funktionen sind für die Bildgenerierung verfügbar:

Modell Name und Version der Modellressource Startphase Features Seitenverhältnisse Unterstützte Sprachen Abrechnung

Imagen 3

Modell	Name und Version der Modellressource	Startphase	Features	Seitenverhältnisse	Unterstützte Sprachen	Abrechnung
Imagen 3	Imagen 3: `imagen-3.0-generate-002` (neues Modell) `imagen-3.0-generate-001` Imagen 3 Fast: `imagen-3.0-fast-generate-001` Dies ist eine Modellvariante mit niedriger Latenz, die Sie für das Prototyping oder für Anwendungsfälle mit niedriger Latenz verwenden können. Imagen 3-Anpassung und Bearbeitung: `imagen-3.0-capability-001` (genehmigte Nutzer)	General Availability	Unterstützte Funktionen: Bilderstellung Digitale Wasserzeichen und Überprüfung Von Nutzern konfigurierbare Sicherheitseinstellungen Prompt-Optimierung mit Prompt-Umschreiber (nur `imagen-3.0-generate-002`-Modell) Bildanpassung (Lernen mit wenigen Beispielen): Anpassung des Motivs (Produkt, Person und Haustier) Stilanpassung Kontrollierte Anpassung (Scribble und Canny-Ecke) Anpassungsanleitung (Stilübertragung) Bildbearbeitung (maskenbasiert): Inpainting (einfügen oder entfernen) Outpainting Produktbildbearbeitung	1:1 - 1024 x 1024 Pixel (quadratisch) 3:4 - 896x1280 4:3 - 1280x896 9:16 - 768x1408 16:9 - 1408 × 768	General Availability: Englisch Vorschau: Chinesisch (vereinfacht) Chinesisch (traditionell) Hindi Japanisch Koreanisch Portugiesisch Spanisch	Ja, die Preise gelten für die Generation. Die Preise für die Imagen 3-Modelle sind mit einer neuen Artikelnummer verknüpft und unterscheiden sich daher von denen anderer Modelle. Alle Funktionen und Einführungsphasen finden Sie in der Übersicht zu Imagen. Die Preise für die einzelnen Funktionen finden Sie auf der Preisseite.

Imagen 3:

imagen-3.0-generate-002 (neues Modell)

imagen-3.0-generate-001

Imagen 3 Fast: imagen-3.0-fast-generate-001

Dies ist eine Modellvariante mit niedriger Latenz, die Sie für das Prototyping oder für Anwendungsfälle mit niedriger Latenz verwenden können.

Imagen 3-Anpassung und Bearbeitung: imagen-3.0-capability-001 (genehmigte Nutzer)

General Availability

Unterstützte Funktionen:

Bilderstellung
Digitale Wasserzeichen und Überprüfung
Von Nutzern konfigurierbare Sicherheitseinstellungen
Prompt-Optimierung mit Prompt-Umschreiber (nur imagen-3.0-generate-002-Modell)
Bildanpassung (Lernen mit wenigen Beispielen):
- Anpassung des Motivs (Produkt, Person und Haustier)
- Stilanpassung
- Kontrollierte Anpassung (Scribble und Canny-Ecke)
- Anpassungsanleitung (Stilübertragung)
Bildbearbeitung (maskenbasiert):
- Inpainting (einfügen oder entfernen)
- Outpainting
- Produktbildbearbeitung

1:1 - 1024 x 1024 Pixel (quadratisch)
3:4 - 896x1280
4:3 - 1280x896
9:16 - 768x1408
16:9 - 1408 × 768

General Availability:

Englisch

Vorschau:

Chinesisch (vereinfacht)
Chinesisch (traditionell)
Hindi
Japanisch
Koreanisch
Portugiesisch
Spanisch

Ja, die Preise gelten für die Generation. Die Preise für die Imagen 3-Modelle sind mit einer neuen Artikelnummer verknüpft und unterscheiden sich daher von denen anderer Modelle.

Alle Funktionen und Einführungsphasen finden Sie in der Übersicht zu Imagen.
Die Preise für die einzelnen Funktionen finden Sie auf der Preisseite.

Hinweise

Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.

In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

Go to project selector

Make sure that billing is enabled for your Google Cloud project.

Enable the Vertex AI API.

Enable the API

In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

Go to project selector

Make sure that billing is enabled for your Google Cloud project.

Enable the Vertex AI API.

Enable the API

Richten Sie die Authentifizierung für Ihre Umgebung ein.

Select the tab for how you plan to use the samples on this page:
Console

When you use the Google Cloud console to access Google Cloud services and APIs, you don't need to set up authentication.
Java

Wenn Sie die Java Beispiele auf dieser Seite in einer lokalen Entwicklungsumgebung verwenden möchten, installieren und initialisieren Sie die gcloud CLI und richten dann die Standardanmeldedaten für Anwendungen mit Ihren Nutzeranmeldedaten ein.
1. Install the Google Cloud CLI.
2. To initialize the gcloud CLI, run the following command:
  gcloud init
3. If you're using a local shell, then create local authentication credentials for your user account:
  gcloud auth application-default login
  You don't need to do this if you're using Cloud Shell.
Weitere Informationen finden Sie unter Authentifizierung für eine lokale Entwicklungsumgebung einrichten in der Dokumentation zur Google Cloud-Authentifizierung.
Node.js

Wenn Sie die Node.js Beispiele auf dieser Seite in einer lokalen Entwicklungsumgebung verwenden möchten, installieren und initialisieren Sie die gcloud CLI und richten dann die Standardanmeldedaten für Anwendungen mit Ihren Nutzeranmeldedaten ein.
1. Install the Google Cloud CLI.
2. To initialize the gcloud CLI, run the following command:
  gcloud init
3. If you're using a local shell, then create local authentication credentials for your user account:
  gcloud auth application-default login
  You don't need to do this if you're using Cloud Shell.
Weitere Informationen finden Sie unter Authentifizierung für eine lokale Entwicklungsumgebung einrichten in der Dokumentation zur Google Cloud-Authentifizierung.
Python

Wenn Sie die Python Beispiele auf dieser Seite in einer lokalen Entwicklungsumgebung verwenden möchten, installieren und initialisieren Sie die gcloud CLI und richten dann die Standardanmeldedaten für Anwendungen mit Ihren Nutzeranmeldedaten ein.
1. Install the Google Cloud CLI.
2. To initialize the gcloud CLI, run the following command:
  gcloud init
3. If you're using a local shell, then create local authentication credentials for your user account:
  gcloud auth application-default login
  You don't need to do this if you're using Cloud Shell.
Weitere Informationen finden Sie unter Authentifizierung für eine lokale Entwicklungsumgebung einrichten in der Dokumentation zur Google Cloud-Authentifizierung.
REST

Verwenden Sie die von der gcloud CLI bereitgestellten Anmeldedaten, um die REST API-Beispiele auf dieser Seite in einer lokalen Entwicklungsumgebung zu verwenden.
Weitere Informationen finden Sie unter Für die Verwendung von REST authentifizieren in der Dokumentation zur Google Cloud-Authentifizierung.

Bilder mit Text generieren

Sie können neue Bilder einfach auf Basis eines beschreibenden Texts als Eingabe erstellen. Die folgenden Beispiele geben grundlegende Anleitungen zum Generieren von Bildern. Sie können je nach Anwendungsfall auch zusätzliche Parameter verwenden.

Console

Öffnen Sie in der Google Cloud Console den Tab Vertex AI Studio > Medien im Vertex AI-Dashboard.
Zum Tab Vertex AI Studio
Geben Sie im Feld Prompt schreiben eine Beschreibung der Bilder ein, die Sie generieren möchten. Weitere Informationen zum Schreiben effektiver Prompts finden Sie in der Anleitung: Prompts.
- Beispiel: Kleines Boot auf dem Wasser am Morgen, Wasserfarben, Illustration
Optional. Wählen Sie im Feld Modelloptionen im Bereich Parameter die zu verwendende Modellversion aus. Weitere Informationen finden Sie unter Modellversionen.
Optional. Ändern Sie die Standard- und erweiterten Parameter.

Diese Funktionen sind vom Modell abhängig. Weitere Informationen finden Sie unter Modellversionen.
Klicken Sie zum Generieren von Bildern auf Generieren.

^{Bildgenerierungs-Ansicht von Bildern, die mit Imagen in Vertex AI über den Prompt erstellt wurden: Kleines rotes Boot auf dem Wasser am Morgen, Wasserfarben, Illustration. Sanfte Farben.}

REST

Weitere Informationen zu imagegeneration-Modellanfragen finden Sie in der API-Referenz des imagegeneration-Modells.

Ersetzen Sie diese Werte in den folgenden Anfragedaten:

PROJECT_ID: Ihre Google Cloud Projekt-ID.
MODEL_VERSION: Die zu verwendende imagegeneration-Modellversion. Verfügbare Werte:
- Imagen 3:
  - imagen-3.0-generate-002 (neueste Version)
  - imagen-3.0-generate-001
  - imagen-3.0-fast-generate-001: Modellversion mit niedriger Latenz.
- Standardversion des Modells:
  - imagegeneration: Verwendet die Standard-Modellversion v.006. Es hat sich bewährt, immer eine Modellversion anzugeben, insbesondere in Produktionsumgebungen.
Weitere Informationen zu Modellversionen und -features finden Sie unter Modellversionen.
LOCATION: Die Region Ihres Projekts. Beispiel: us-central1, europe-west2 oder asia-northeast3. Eine Liste der verfügbaren Regionen finden Sie unter Generative AI an Vertex AI-Standorten.
TEXT_PROMPT: Der Text-Prompt, der bestimmt, welche Bilder das Modell generiert. Dieses Feld ist sowohl zum Erstellen als auch zum Bearbeiten erforderlich.
IMAGE_COUNT ist die Anzahl der generierten Bilder. Zulässige Ganzzahlwerte: 1–8 (imagegeneration@002), 1–4 (alle anderen Modellversionen). Standardwert: 4

Zusätzliche optionale Parameter

Verwenden Sie je nach Anwendungsfall die folgenden optionalen Variablen. Fügen Sie einige oder alle der folgenden Parameter in das "parameters": {}-Objekt ein. Diese Liste enthält gängige optionale Parameter und erhebt keinen Anspruch auf Vollständigkeit. Weitere Informationen zu optionalen Parametern finden Sie in der Imagen API-Referenz: Bilder generieren.

"parameters": {
  "sampleCount": IMAGE_COUNT,
  "addWatermark": ADD_WATERMARK,
  "aspectRatio": "ASPECT_RATIO",
  "enhancePrompt": ENABLE_PROMPT_REWRITING,
  "includeRaiReason": INCLUDE_RAI_REASON,
  "includeSafetyAttributes": INCLUDE_SAFETY_ATTRIBUTES,
  "outputOptions": {
    "mimeType": "MIME_TYPE",
    "compressionQuality": COMPRESSION_QUALITY
  },
  "personGeneration": "PERSON_SETTING",
  "safetySetting": "SAFETY_SETTING",
  "seed": SEED_NUMBER,
  "storageUri": "OUTPUT_STORAGE_URI"
}

ADD_WATERMARK: boolean. Optional. Ob ein Wasserzeichen für generierte Bilder aktiviert werden soll. Alle Bilder, die generiert werden, wenn das Feld auf true festgelegt ist, enthalten eine digitale SynthID, mit der Sie ein mit Wasserzeichen versehenes Bild prüfen können. Wenn Sie dieses Feld weglassen, wird der Standardwert true verwendet. Sie müssen den Wert auf false festlegen, um diese Funktion zu deaktivieren. Sie können das Feld seed nur dann verwenden, um eine deterministische Ausgabe zu erhalten, wenn dieses Feld auf false gesetzt ist.
ASPECT_RATIO: String. Optional. Ein Parameter für den Generierungsmodus, der das Seitenverhältnis steuert. Unterstützte Seitenverhältniswerte und ihre beabsichtigte Verwendung:
- 1:1 (Standard, Quadrat)
- 3:4 (Werbung, soziale Medien)
- 4:3 (Fernsehen, Fotografie)
- 16:9 (Querformat)
- 9:16 Hochformat
ENABLE_PROMPT_REWRITING: boolean. Optional. Ein Parameter, mit dem eine LLM-basierte Funktion zum Umschreiben von Prompts verwendet wird, um Bilder mit höherer Qualität zu liefern, die die Absicht des ursprünglichen Prompts besser widerspiegeln. Wenn Sie diese Funktion deaktivieren, kann sich das auf die Bildqualität und die Einhaltung der Fristen auswirken. Standardwert: true.
INCLUDE_RAI_REASON: boolean. Optional. Gibt an, ob der von der verantwortungsbewussten KI gefilterte Grundcode in Antworten mit blockierten Eingabe- oder Ausgabeinhalten aktiviert sein soll. Standardwert: false.
INCLUDE_SAFETY_ATTRIBUTES: boolean. Optional. Gibt an, ob gerundete Werte der verantwortungsbewussten KI für eine Liste von Sicherheitsattributen in Antworten für ungefilterte Eingabe und Ausgabe aktiviert werden sollen. Kategorien für Sicherheitsattribute: "Death, Harm & Tragedy", "Firearms & Weapons", "Hate", "Health", "Illicit Drugs", "Politics", "Porn", "Religion & Belief","Toxic", "Violence", "Vulgarity", "War & Conflict". Standardwert: false.
MIME_TYPE: String. Optional. Der MIME-Typ des Bildinhalts. Verfügbare Werte:
- image/jpeg
- image/gif
- image/png
- image/webp
- image/bmp
- image/tiff
- image/vnd.microsoft.icon
COMPRESSION_QUALITY: Ganzzahl. Optional. Gilt nur für JPEG-Ausgabedateien. Die Detailgenauigkeit, die das Modell bei Bildern beibehält, die im JPEG-Dateiformat generiert werden. Werte:0 bis 100. Je höher die Zahl, desto stärker die Komprimierung. Standard: 75.
PERSON_SETTING: String. Optional. Die Sicherheitseinstellung, die bestimmt, welche Art von Personen- oder Gesichtererstellung das Modell zulässt. Verfügbare Werte:
- allow_adult (Standard): Es dürfen nur Erwachsene generiert werden, mit Ausnahme von Prominenten. Die Generierung von Prominenten ist für keine Einstellung zulässig.
- dont_allow: Deaktivieren Sie die Aufnahme von Personen oder Gesichtern in generierten Bildern.
SAFETY_SETTING: String. Optional. Eine Einstellung, mit der die Sicherheitsfiltergrenzwerte für generierte Bilder gesteuert werden. Verfügbare Werte:
- block_low_and_above: Der höchste Sicherheitsgrenzwert, der dazu führt, dass die größte Anzahl der generierten Bilder gefiltert wird. Vorheriger Wert: block_most.
- block_medium_and_above (Standardeinstellung): Ein mittlerer Sicherheitsgrenzwert, der potenziell schädliche und sichere Inhalte ausgeglichen behandelt. Vorheriger Wert: block_some.
- block_only_high: Ein Sicherheitsgrenzwert, der die Anzahl der Anfragen reduziert, die aufgrund von Sicherheitsfiltern blockiert werden. Diese Einstellung kann dazu führen, dass Imagen mehr anstößige Inhalte generiert. Vorheriger Wert: block_few.
SEED_NUMBER: Ganzzahl. Optional. Jede nicht negative Ganzzahl, die Sie angeben, um Ausgabebilder deterministisch zu machen. Die Angabe derselben Quell-Nummer führt immer zu denselben Ausgabebildern. Wenn das von dir verwendete Modell digitale Wasserzeichen unterstützt, musst du "addWatermark": false festlegen, um dieses Feld zu verwenden. Zulässige Ganzzahlwerte: 1–2147483647.
OUTPUT_STORAGE_URI: String. Optional. Der Cloud Storage-Bucket, in dem die Ausgabebilder gespeichert werden sollen. Andernfalls werden in der Antwort base64-codierte Bildbyte zurückgegeben. Beispielwert: gs://image-bucket/output/.

HTTP-Methode und URL:

POST https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/MODEL_VERSION:predict

JSON-Text der Anfrage:

{
  "instances": [
    {
      "prompt": "TEXT_PROMPT"
    }
  ],
  "parameters": {
    "sampleCount": IMAGE_COUNT
  }
}

Wenn Sie die Anfrage senden möchten, wählen Sie eine der folgenden Optionen aus:

curl

Hinweis: Der folgende Befehl setzt voraus, dass Sie sich mit Ihrem Nutzerkonto bei der gcloud CLI angemeldet haben. Dazu haben Sie gcloud init oder gcloud auth login ausgeführt oder die Cloud Shell genutzt, die Sie automatisch bei der gcloud CLI anmeldet. Um herauszufinden, welches Konto gerade aktiv ist, führen Sie gcloud auth list aus.

Speichern Sie den Anfragetext in einer Datei mit dem Namen request.json und führen Sie den folgenden Befehl aus:

curl -X POST \
     -H "Authorization: Bearer $(gcloud auth print-access-token)" \
     -H "Content-Type: application/json; charset=utf-8" \
     -d @request.json \
     "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/MODEL_VERSION:predict"

PowerShell

Hinweis: Der folgende Befehl setzt voraus, dass Sie sich mit Ihrem Nutzerkonto bei der gcloud CLI angemeldet haben. Dazu führen Sie gcloud init oder gcloud auth login aus. Um herauszufinden, welches Konto gerade aktiv ist, führen Sie gcloud auth list aus.

Speichern Sie den Anfragetext in einer Datei mit dem Namen request.json und führen Sie den folgenden Befehl aus:

$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }

Invoke-WebRequest `
    -Method POST `
    -Headers $headers `
    -ContentType: "application/json; charset=utf-8" `
    -InFile request.json `
    -Uri "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/MODEL_VERSION:predict" | Select-Object -Expand Content

Die folgende Beispielantwort bezieht sich auf eine Anfrage mit "sampleCount": 2. Die Antwort gibt zwei Vorhersageobjekte zurück, wobei die generierten Bildbyte base64-codiert sind.

{
  "predictions": [
    {
      "bytesBase64Encoded": "BASE64_IMG_BYTES",
      "mimeType": "image/png"
    },
    {
      "mimeType": "image/png",
      "bytesBase64Encoded": "BASE64_IMG_BYTES"
    }
  ]
}

Wenn Sie ein Modell verwenden, das die Prompt-Optimierung unterstützt, enthält die Antwort ein zusätzliches prompt-Feld mit dem erweiterten Prompt, der für die Generierung verwendet wurde:

{
  "predictions": [
    {
      "mimeType": "MIME_TYPE",
      "prompt": "ENHANCED_PROMPT_1",
      "bytesBase64Encoded": "BASE64_IMG_BYTES_1"
    },
    {
      "mimeType": "MIME_TYPE",
      "prompt": "ENHANCED_PROMPT_2",
      "bytesBase64Encoded": "BASE64_IMG_BYTES_2"
    }
  ]
}

Python

Bevor Sie dieses Beispiel anwenden, folgen Sie den Python-Einrichtungsschritten in der Vertex AI-Kurzanleitung zur Verwendung von Clientbibliotheken. Weitere Informationen finden Sie in der Referenzdokumentation zur Vertex AI Python API.

Richten Sie zur Authentifizierung bei Vertex AI Standardanmeldedaten für Anwendungen ein. Weitere Informationen finden Sie unter Authentifizierung für eine lokale Entwicklungsumgebung einrichten.

In diesem Beispiel rufen Sie die Methode generate_images in der ImageGenerationModel auf und speichern die generierten Bilder lokal. Anschließend können Sie optional die Methode show() in einem Notebook verwenden, um die generierten Images anzuzeigen. Weitere Informationen zu Modellversionen und -features finden Sie unter Modellversionen.


import vertexai
from vertexai.preview.vision_models import ImageGenerationModel

# TODO(developer): Update and un-comment below lines
# PROJECT_ID = "your-project-id"
# output_file = "input-image.png"
# prompt = "" # The text prompt describing what you want to see.

vertexai.init(project=PROJECT_ID, location="us-central1")

model = ImageGenerationModel.from_pretrained("imagen-3.0-generate-002")

images = model.generate_images(
    prompt=prompt,
    # Optional parameters
    number_of_images=1,
    language="en",
    # You can't use a seed value and watermark at the same time.
    # add_watermark=False,
    # seed=100,
    aspect_ratio="1:1",
    safety_filter_level="block_some",
    person_generation="allow_adult",
)

images[0].save(location=output_file, include_generation_parameters=False)

# Optional. View the generated image in a notebook.
# images[0].show()

print(f"Created output image using {len(images[0]._image_bytes)} bytes")
# Example response:
# Created output image using 1234567 bytes

Java

Bevor Sie dieses Beispiel anwenden, folgen Sie den Java-Einrichtungsschritten in der Vertex AI-Kurzanleitung zur Verwendung von Clientbibliotheken. Weitere Informationen finden Sie in der Referenzdokumentation zur Vertex AI Java API.

Richten Sie zur Authentifizierung bei Vertex AI Standardanmeldedaten für Anwendungen ein. Weitere Informationen finden Sie unter Authentifizierung für eine lokale Entwicklungsumgebung einrichten.

In diesem Beispiel geben Sie das imagen-3.0-generate-001-Modell als Teil eines EndpointName an. Der EndpointName wird an die Methode predict übergeben, die auf einem PredictionServiceClient aufgerufen wird. Der Dienst generiert Bilder, die dann lokal gespeichert werden. Weitere Informationen zu Modellversionen und -features finden Sie unter Modellversionen.


import com.google.api.gax.rpc.ApiException;
import com.google.cloud.aiplatform.v1.EndpointName;
import com.google.cloud.aiplatform.v1.PredictResponse;
import com.google.cloud.aiplatform.v1.PredictionServiceClient;
import com.google.cloud.aiplatform.v1.PredictionServiceSettings;
import com.google.gson.Gson;
import com.google.protobuf.InvalidProtocolBufferException;
import com.google.protobuf.Value;
import com.google.protobuf.util.JsonFormat;
import java.io.IOException;
import java.nio.file.Files;
import java.nio.file.Path;
import java.util.Base64;
import java.util.Collections;
import java.util.HashMap;
import java.util.Map;

public class GenerateImageSample {

  public static void main(String[] args) throws IOException {
    // TODO(developer): Replace these variables before running the sample.
    String projectId = "my-project-id";
    String location = "us-central1";
    String prompt = ""; // The text prompt describing what you want to see.

    generateImage(projectId, location, prompt);
  }

  // Generate an image using a text prompt using an Imagen model
  public static PredictResponse generateImage(String projectId, String location, String prompt)
      throws ApiException, IOException {
    final String endpoint = String.format("%s-aiplatform.googleapis.com:443", location);
    PredictionServiceSettings predictionServiceSettings =
        PredictionServiceSettings.newBuilder().setEndpoint(endpoint).build();

    // Initialize client that will be used to send requests. This client only needs to be created
    // once, and can be reused for multiple requests.
    try (PredictionServiceClient predictionServiceClient =
        PredictionServiceClient.create(predictionServiceSettings)) {

      final EndpointName endpointName =
          EndpointName.ofProjectLocationPublisherModelName(
              projectId, location, "google", "imagen-3.0-generate-001");

      Map<String, Object> instancesMap = new HashMap<>();
      instancesMap.put("prompt", prompt);
      Value instances = mapToValue(instancesMap);

      Map<String, Object> paramsMap = new HashMap<>();
      paramsMap.put("sampleCount", 1);
      // You can't use a seed value and watermark at the same time.
      // paramsMap.put("seed", 100);
      // paramsMap.put("addWatermark", false);
      paramsMap.put("aspectRatio", "1:1");
      paramsMap.put("safetyFilterLevel", "block_some");
      paramsMap.put("personGeneration", "allow_adult");
      Value parameters = mapToValue(paramsMap);

      PredictResponse predictResponse =
          predictionServiceClient.predict(
              endpointName, Collections.singletonList(instances), parameters);

      for (Value prediction : predictResponse.getPredictionsList()) {
        Map<String, Value> fieldsMap = prediction.getStructValue().getFieldsMap();
        if (fieldsMap.containsKey("bytesBase64Encoded")) {
          String bytesBase64Encoded = fieldsMap.get("bytesBase64Encoded").getStringValue();
          Path tmpPath = Files.createTempFile("imagen-", ".png");
          Files.write(tmpPath, Base64.getDecoder().decode(bytesBase64Encoded));
          System.out.format("Image file written to: %s\n", tmpPath.toUri());
        }
      }
      return predictResponse;
    }
  }

  private static Value mapToValue(Map<String, Object> map) throws InvalidProtocolBufferException {
    Gson gson = new Gson();
    String json = gson.toJson(map);
    Value.Builder builder = Value.newBuilder();
    JsonFormat.parser().merge(json, builder);
    return builder.build();
  }
}

Node.js

Bevor Sie dieses Beispiel anwenden, folgen Sie den Node.js-Einrichtungsschritten in der Vertex AI-Kurzanleitung zur Verwendung von Clientbibliotheken. Weitere Informationen finden Sie in der Referenzdokumentation zur Vertex AI Node.js API.

Richten Sie zur Authentifizierung bei Vertex AI Standardanmeldedaten für Anwendungen ein. Weitere Informationen finden Sie unter Authentifizierung für eine lokale Entwicklungsumgebung einrichten.

In diesem Beispiel rufen Sie die Methode in einem predict PredictionServiceClient auf. Der Dienst generiert Bilder, die dann lokal gespeichert werden. Weitere Informationen zu Modellversionen und -features finden Sie unter Modellversionen.

/**
 * TODO(developer): Update these variables before running the sample.
 */
const projectId = process.env.CAIP_PROJECT_ID;
const location = 'us-central1';
const prompt = 'a dog reading a newspaper';

const aiplatform = require('@google-cloud/aiplatform');

// Imports the Google Cloud Prediction Service Client library
const {PredictionServiceClient} = aiplatform.v1;

// Import the helper module for converting arbitrary protobuf.Value objects
const {helpers} = aiplatform;

// Specifies the location of the api endpoint
const clientOptions = {
  apiEndpoint: `${location}-aiplatform.googleapis.com`,
};

// Instantiates a client
const predictionServiceClient = new PredictionServiceClient(clientOptions);

async function generateImage() {
  const fs = require('fs');
  const util = require('util');
  // Configure the parent resource
  const endpoint = `projects/${projectId}/locations/${location}/publishers/google/models/imagen-3.0-generate-001`;

  const promptText = {
    prompt: prompt, // The text prompt describing what you want to see
  };
  const instanceValue = helpers.toValue(promptText);
  const instances = [instanceValue];

  const parameter = {
    sampleCount: 1,
    // You can't use a seed value and watermark at the same time.
    // seed: 100,
    // addWatermark: false,
    aspectRatio: '1:1',
    safetyFilterLevel: 'block_some',
    personGeneration: 'allow_adult',
  };
  const parameters = helpers.toValue(parameter);

  const request = {
    endpoint,
    instances,
    parameters,
  };

  // Predict request
  const [response] = await predictionServiceClient.predict(request);
  const predictions = response.predictions;
  if (predictions.length === 0) {
    console.log(
      'No image was generated. Check the request parameters and prompt.'
    );
  } else {
    let i = 1;
    for (const prediction of predictions) {
      const buff = Buffer.from(
        prediction.structValue.fields.bytesBase64Encoded.stringValue,
        'base64'
      );
      // Write image content to the output file
      const writeFile = util.promisify(fs.writeFile);
      const filename = `output${i}.png`;
      await writeFile(filename, buff);
      console.log(`Saved image ${filename}`);
      i++;
    }
  }
}
await generateImage();

Parameter zum Generieren von Bildern verwenden

Wenn Sie Bilder generieren, gibt es je nach Anwendungsfall mehrere Standard- und erweiterte Parameter.

Bildwasserzeichen hinzufügen oder prüfen

Standardmäßig wird allen Bildern, die mit einer Modellversion generiert wurden, die die Generierung von Wasserzeichen unterstützt, ein digitales Wasserzeichen hinzugefügt. Dabei wird den Bildern ein unsichtbares digitales Wasserzeichen hinzugefügt, das SynthID genannt wird. Sie können dann prüfen, ob ein Bild ein digitales Wasserzeichen enthält.

Bilder mit Wasserzeichen erstellen

Verwenden Sie die folgenden Beispiele, um Bilder mit einem digitalen Wasserzeichen zu generieren.

Console

Öffnen Sie in der Google Cloud Console den Tab Vertex AI Studio > Medien im Vertex AI-Dashboard.
Zum Tab Vertex AI Studio
Geben Sie im Feld Prompt schreiben eine Beschreibung der Bilder ein, die Sie generieren möchten. Weitere Informationen zum Schreiben effektiver Prompts finden Sie in der Anleitung: Prompts.
- Beispiel: Kleines Boot auf dem Wasser am Morgen, Wasserfarben, Illustration
Optional. Wählen Sie im Feld Modelloptionen im Bereich Parameter die zu verwendende Modellversion aus. Weitere Informationen finden Sie unter Modellversionen.
Optional. Ändern Sie die Standard- und erweiterten Parameter.

Diese Funktionen sind vom Modell abhängig. Weitere Informationen finden Sie unter Modellversionen.
Klicken Sie zum Generieren von Bildern auf Generieren.
Modellversion 006 und höher:Den generierten Bildern wird automatisch ein digitales Wasserzeichen hinzugefügt. Sie können digitale Wasserzeichen nicht für die Bildgenerierung mit der Google Cloud Console deaktivieren.

Sie können ein Bild auswählen, um das Fenster Bilddetail aufzurufen. Bilder mit Wasserzeichen haben das Logo Digitales Wasserzeichen. Sie können auch explizit ein Bildwasserzeichen prüfen.

^{Bilddetail-Ansicht eines mit Wasserzeichen versehenen Bildes, das mit Imagen 2 über den Prompt kleines rotes Boot auf dem Wasser am Morgen, Wasserfarben, Illustration. Sanfte Farben generiert wurde.}

REST

Weitere Informationen zu imagegeneration-Modellanfragen finden Sie in der API-Referenz des imagegeneration-Modells.

Ersetzen Sie diese Werte in den folgenden Anfragedaten:

PROJECT_ID: Ihre Google Cloud Projekt-ID.
MODEL_VERSION: Die zu verwendende imagegeneration-Modellversion. Verfügbare Werte:
- imagen-3.0-generate-002 (neueste Version)
- imagen-3.0-generate-001
- imagen-3.0-fast-generate-001: Modellversion mit niedriger Latenz.
- imagegeneration@006
Weitere Informationen zu Modellversionen und -features finden Sie unter Modellversionen.
LOCATION: Die Region Ihres Projekts. Beispiel: us-central1, europe-west2 oder asia-northeast3. Eine Liste der verfügbaren Regionen finden Sie unter Generative AI an Vertex AI-Standorten.
TEXT_PROMPT: Der Text-Prompt, der bestimmt, welche Bilder das Modell generiert. Dieses Feld ist sowohl zum Erstellen als auch zum Bearbeiten erforderlich.
IMAGE_COUNT ist die Anzahl der generierten Bilder. Zulässige Ganzzahlwerte: 1–8 (imagegeneration@002), 1–4 (alle anderen Modellversionen). Standardwert: 4
ADD_WATERMARK: boolean. Optional. Ob ein Wasserzeichen für generierte Bilder aktiviert werden soll. Alle Bilder, die generiert werden, wenn das Feld auf true festgelegt ist, enthalten eine digitale SynthID, mit der Sie ein mit Wasserzeichen versehenes Bild prüfen können. Wenn Sie dieses Feld weglassen, wird der Standardwert true verwendet. Sie müssen den Wert auf false festlegen, um diese Funktion zu deaktivieren. Sie können das Feld seed nur dann verwenden, um eine deterministische Ausgabe zu erhalten, wenn dieses Feld auf false gesetzt ist.

HTTP-Methode und URL:

POST https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/MODEL_VERSION:predict

JSON-Text der Anfrage:

{
  "instances": [
    {
      "prompt": "TEXT_PROMPT"
    }
  ],
  "parameters": {
    "sampleCount": IMAGE_COUNT,
    "addWatermark": ADD_WATERMARK
  }
}

Wenn Sie die Anfrage senden möchten, wählen Sie eine der folgenden Optionen aus:

curl

Speichern Sie den Anfragetext in einer Datei mit dem Namen request.json und führen Sie den folgenden Befehl aus:

curl -X POST \
     -H "Authorization: Bearer $(gcloud auth print-access-token)" \
     -H "Content-Type: application/json; charset=utf-8" \
     -d @request.json \
     "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/MODEL_VERSION:predict"

PowerShell

Speichern Sie den Anfragetext in einer Datei mit dem Namen request.json und führen Sie den folgenden Befehl aus:

$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }

Invoke-WebRequest `
    -Method POST `
    -Headers $headers `
    -ContentType: "application/json; charset=utf-8" `
    -InFile request.json `
    -Uri "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/MODEL_VERSION:predict" | Select-Object -Expand Content

Die folgende Beispielantwort bezieht sich auf eine Anfrage mit "sampleCount": 2. Die Antwort gibt zwei Vorhersageobjekte zurück, wobei die generierten Bildbyte base64-codiert sind. Das digitale Wasserzeichen wird Bildern automatisch hinzugefügt. Die Antwort ist daher identisch mit der Antwort ohne Wasserzeichen.

{
  "predictions": [
    {
      "mimeType": "image/png",
      "bytesBase64Encoded": "BASE64_IMG_BYTES"
    },
    {
      "bytesBase64Encoded": "BASE64_IMG_BYTES",
      "mimeType": "image/png"
    }
  ]
}

Vertex AI SDK für Python


import vertexai
from vertexai.preview.vision_models import ImageGenerationModel

# TODO(developer): Update and un-comment below lines
# PROJECT_ID = "your-project-id"
# output_file = "input-image.png"
# prompt = "" # The text prompt describing what you want to see.

vertexai.init(project=PROJECT_ID, location="us-central1")

model = ImageGenerationModel.from_pretrained("imagen-3.0-generate-002")

images = model.generate_images(
    prompt=prompt,
    # Optional parameters
    number_of_images=1,
    language="en",
    # You can't use a seed value and watermark at the same time.
    # add_watermark=False,
    # seed=100,
    aspect_ratio="1:1",
    safety_filter_level="block_some",
    person_generation="allow_adult",
)

images[0].save(location=output_file, include_generation_parameters=False)

# Optional. View the generated image in a notebook.
# images[0].show()

print(f"Created output image using {len(images[0]._image_bytes)} bytes")
# Example response:
# Created output image using 1234567 bytes

Node.js

/**
 * TODO(developer): Update these variables before running the sample.
 */
const projectId = process.env.CAIP_PROJECT_ID;
const location = 'us-central1';
const prompt = 'a dog reading a newspaper';

const aiplatform = require('@google-cloud/aiplatform');

// Imports the Google Cloud Prediction Service Client library
const {PredictionServiceClient} = aiplatform.v1;

// Import the helper module for converting arbitrary protobuf.Value objects
const {helpers} = aiplatform;

// Specifies the location of the api endpoint
const clientOptions = {
  apiEndpoint: `${location}-aiplatform.googleapis.com`,
};

// Instantiates a client
const predictionServiceClient = new PredictionServiceClient(clientOptions);

async function generateImage() {
  const fs = require('fs');
  const util = require('util');
  // Configure the parent resource
  const endpoint = `projects/${projectId}/locations/${location}/publishers/google/models/imagen-3.0-generate-001`;

  const promptText = {
    prompt: prompt, // The text prompt describing what you want to see
  };
  const instanceValue = helpers.toValue(promptText);
  const instances = [instanceValue];

  const parameter = {
    sampleCount: 1,
    // You can't use a seed value and watermark at the same time.
    // seed: 100,
    // addWatermark: false,
    aspectRatio: '1:1',
    safetyFilterLevel: 'block_some',
    personGeneration: 'allow_adult',
  };
  const parameters = helpers.toValue(parameter);

  const request = {
    endpoint,
    instances,
    parameters,
  };

  // Predict request
  const [response] = await predictionServiceClient.predict(request);
  const predictions = response.predictions;
  if (predictions.length === 0) {
    console.log(
      'No image was generated. Check the request parameters and prompt.'
    );
  } else {
    let i = 1;
    for (const prediction of predictions) {
      const buff = Buffer.from(
        prediction.structValue.fields.bytesBase64Encoded.stringValue,
        'base64'
      );
      // Write image content to the output file
      const writeFile = util.promisify(fs.writeFile);
      const filename = `output${i}.png`;
      await writeFile(filename, buff);
      console.log(`Saved image ${filename}`);
      i++;
    }
  }
}
await generateImage();

Bild mit Wasserzeichen prüfen

Anhand der folgenden Beispiele können Sie prüfen, ob ein Bild ein Wasserzeichen enthält.

Console

Öffnen Sie in der Google Cloud Console den Tab Vertex AI Studio > Medien im Vertex AI-Dashboard.

Zum Tab Vertex AI Studio
Klicken Sie im unteren Bereich auf Bestätigen.
Klicken Sie auf Bild hochladen.
Wählen Sie ein lokal gespeichertes Bild aus.

REST

Ersetzen Sie diese Werte in den folgenden Anfragedaten:

PROJECT_ID: Ihre Google Cloud Projekt-ID.
LOCATION: Die Region Ihres Projekts. Beispiel: us-central1, europe-west2 oder asia-northeast3. Eine Liste der verfügbaren Regionen finden Sie unter Generative AI an Vertex AI-Standorten.
B64_IMAGE: Das Bild, das geprüft werden soll und ein digitales Wasserzeichen enthält. Das Bild muss als base64-codierter Bytestring angegeben werden. Größenbeschränkung: 10 MB.

HTTP-Methode und URL:

POST https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/imageverification@001:predict

JSON-Text der Anfrage:

{
  "instances": [
    {
      "image": {
        "bytesBase64Encoded": "B64_IMAGE"
      }
    }
  ],
  "parameters": {
    "watermarkVerification": true
  }
}

Wenn Sie die Anfrage senden möchten, wählen Sie eine der folgenden Optionen aus:

curl

Speichern Sie den Anfragetext in einer Datei mit dem Namen request.json und führen Sie den folgenden Befehl aus:

curl -X POST \
     -H "Authorization: Bearer $(gcloud auth print-access-token)" \
     -H "Content-Type: application/json; charset=utf-8" \
     -d @request.json \
     "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/imageverification@001:predict"

PowerShell

Speichern Sie den Anfragetext in einer Datei mit dem Namen request.json und führen Sie den folgenden Befehl aus:

$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }

Invoke-WebRequest `
    -Method POST `
    -Headers $headers `
    -ContentType: "application/json; charset=utf-8" `
    -InFile request.json `
    -Uri "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/imageverification@001:predict" | Select-Object -Expand Content

Die folgende Beispielantwort bezieht sich auf eine Anfrage mit einem Bild, das ein digitales Wasserzeichen enthält. Das Entscheidungsfeld kann einen der folgenden Werte zurückgeben: ACCEPT oder REJECT.

{
  "predictions": [
    {
      "decision": "ACCEPT"
    }
  ]
}

Vertex AI SDK für Python


import vertexai
from vertexai.preview.vision_models import (
    Image,
    WatermarkVerificationModel,
)

# TODO(developer): Update and un-comment below lines
# PROJECT_ID = "your-project-id"
# input_file = "input-image.png"

vertexai.init(project=PROJECT_ID, location="us-central1")

verification_model = WatermarkVerificationModel.from_pretrained(
    "imageverification@001"
)
image = Image.load_from_file(location=input_file)

watermark_verification_response = verification_model.verify_image(image)

print(
    f"Watermark verification result: {watermark_verification_response.watermark_verification_result}"
)
# Example response:
# Watermark verification result: ACCEPT
# or "REJECT" if the image does not contain a digital watermark.

Node.js

/**
 * TODO(developer): Update these variables before running the sample.
 */
const projectId = process.env.CAIP_PROJECT_ID;
const location = 'us-central1';
const inputFile = 'resources/dog_newspaper.png'; // has watermark

const aiplatform = require('@google-cloud/aiplatform');

// Imports the Google Cloud Prediction Service Client library
const {PredictionServiceClient} = aiplatform.v1;

// Import the helper module for converting arbitrary protobuf.Value objects
const {helpers} = aiplatform;

// Specifies the location of the api endpoint
const clientOptions = {
  apiEndpoint: `${location}-aiplatform.googleapis.com`,
};

// Instantiates a client
const predictionServiceClient = new PredictionServiceClient(clientOptions);

async function verifyImageWatermark() {
  const fs = require('fs');
  // Configure the parent resource
  const endpoint = `projects/${projectId}/locations/${location}/publishers/google/models/imageverification@001`;

  const imageFile = fs.readFileSync(inputFile);
  // Convert the image data to a Buffer and base64 encode it.
  const encodedImage = Buffer.from(imageFile).toString('base64');

  const instance = {
    image: {
      bytesBase64Encoded: encodedImage,
    },
  };
  const instanceValue = helpers.toValue(instance);
  const instances = [instanceValue];

  const request = {
    endpoint,
    instances,
  };

  // Predict request
  const [response] = await predictionServiceClient.predict(request);
  const predictions = response.predictions;
  if (predictions.length === 0) {
    console.log('No decision was generated. Check the request image.');
  } else {
    predictions.forEach(prediction => {
      // "ACCEPT" if the image contains a digital watermark
      // "REJECT" if the image does not contain a digital watermark
      console.log(prediction.structValue.fields.decision.stringValue);
    });
  }
}
await verifyImageWatermark();

RAI-Sicherheitseinstellungen (Verantwortungsbewusste Anwendung von KI) konfigurieren

Es gibt mehrere RAI-Filter (Responsible AI), die Sie mit einem Modell zur Bildgenerierung verwenden können. Sie können das Modell beispielsweise RAI-Filtercodes für blockierte Inhalte melden lassen, Personen- oder Gesichtererstellung mithilfe von RAI-Filtern deaktivieren, die Ebene der Inhaltsfilterung festlegen oder gerundete RAI-Bewertungen einer Liste mit Sicherheitattributen für Eingabe und Ausgabe zurückgeben lassen.

Ausführlichere Informationen zu verantwortungsbewusster Anwendung von KI (RAI), den zugehörigen Parametern und ihrer Beispielausgabe finden Sie unter Verantwortungsbewusste Anwendung von KI für Imagen verstehen und konfigurieren.

In den folgenden Beispielen wird gezeigt, wie Sie verfügbare RAI-Parameter für die Bildgenerierung festlegen.

Console

Öffnen Sie in der Google Cloud Console den Tab Vertex AI Studio > Medien im Vertex AI-Dashboard.

Zum Tab Vertex AI Studio
Fügen Sie den Textprompt hinzu und wählen Sie die Eingabeparameter aus.
Wenn die Ansicht nicht maximiert ist, klicken Sie auf Erweiterte Optionen.
Klicken Sie auf Sicherheitseinstellungen.
Wählen Sie die Sicherheitseinstellungen aus:
- Generierung von Personen/Gesichtern: Wählen Sie eine Einstellung aus:
  - Allow (All ages)
  - Allow (Adults only)
  - Don't allow
- Schwellenwert für Sicherheitsfilter: Wählen Sie eine Einstellung aus:
  - Block low and above
  - Block medium and above
  - Block only high
Klicken Sie auf Speichern.
Klicken Sie auf Erstellen.

REST

Ersetzen Sie diese Werte in den folgenden Anfragedaten:

PROJECT_ID: Ihre Google Cloud Projekt-ID.
LOCATION: Die Region Ihres Projekts. Beispiel: us-central1, europe-west2 oder asia-northeast3. Eine Liste der verfügbaren Regionen finden Sie unter Generative AI an Vertex AI-Standorten.
TEXT_PROMPT: Der Text-Prompt, der bestimmt, welche Bilder das Modell generiert. Dieses Feld ist sowohl zum Erstellen als auch zum Bearbeiten erforderlich.
IMAGE_COUNT ist die Anzahl der generierten Bilder. Zulässige Ganzzahlwerte: 1–8 (imagegeneration@002), 1–4 (alle anderen Modellversionen). Standardwert: 4
SAFETY_SETTING: String. Optional. Eine Einstellung, mit der die Sicherheitsfiltergrenzwerte für generierte Bilder gesteuert werden. Verfügbare Werte:
- block_low_and_above: Der höchste Sicherheitsgrenzwert, der dazu führt, dass die größte Anzahl der generierten Bilder gefiltert wird. Vorheriger Wert: block_most.
- block_medium_and_above (Standardeinstellung): Ein mittlerer Sicherheitsgrenzwert, der potenziell schädliche und sichere Inhalte ausgeglichen behandelt. Vorheriger Wert: block_some.
- block_only_high: Ein Sicherheitsgrenzwert, der die Anzahl der Anfragen reduziert, die aufgrund von Sicherheitsfiltern blockiert werden. Diese Einstellung kann dazu führen, dass Imagen mehr anstößige Inhalte generiert. Vorheriger Wert: block_few.
PERSON_SETTING: String. Optional. Die Sicherheitseinstellung, die bestimmt, welche Art von Personen- oder Gesichtererstellung das Modell zulässt. Verfügbare Werte:
- allow_adult (Standard): Es dürfen nur Erwachsene generiert werden, mit Ausnahme von Prominenten. Die Generierung von Prominenten ist für keine Einstellung zulässig.
- dont_allow: Deaktivieren Sie die Aufnahme von Personen oder Gesichtern in generierten Bildern.
INCLUDE_RAI_REASON: boolean. Optional. Gibt an, ob der von der verantwortungsbewussten KI gefilterte Grundcode in Antworten mit blockierten Eingabe- oder Ausgabeinhalten aktiviert sein soll. Standardwert: false.
INCLUDE_SAFETY_ATTRIBUTES: boolean. Optional. Gibt an, ob gerundete Werte der verantwortungsbewussten KI für eine Liste von Sicherheitsattributen in Antworten für ungefilterte Eingabe und Ausgabe aktiviert werden sollen. Kategorien für Sicherheitsattribute: "Death, Harm & Tragedy", "Firearms & Weapons", "Hate", "Health", "Illicit Drugs", "Politics", "Porn", "Religion & Belief","Toxic", "Violence", "Vulgarity", "War & Conflict". Standardwert: false.

HTTP-Methode und URL:

POST https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/imagegeneration@006:predict

JSON-Text der Anfrage:

{
  "instances": [
    {
      "prompt": "TEXT_PROMPT"
    }
  ],
  "parameters": {
    "sampleCount": IMAGE_COUNT,
    "safetySetting": "SAFETY_SETTING",
    "personGeneration": "PERSON_SETTING",
    "includeRaiReason": INCLUDE_RAI_REASON,
    "includeSafetyAttributes": INCLUDE_SAFETY_ATTRIBUTES
  }
}

Wenn Sie die Anfrage senden möchten, wählen Sie eine der folgenden Optionen aus:

curl

Speichern Sie den Anfragetext in einer Datei mit dem Namen request.json und führen Sie den folgenden Befehl aus:

curl -X POST \
     -H "Authorization: Bearer $(gcloud auth print-access-token)" \
     -H "Content-Type: application/json; charset=utf-8" \
     -d @request.json \
     "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/imagegeneration@006:predict"

PowerShell

Speichern Sie den Anfragetext in einer Datei mit dem Namen request.json und führen Sie den folgenden Befehl aus:

$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }

Invoke-WebRequest `
    -Method POST `
    -Headers $headers `
    -ContentType: "application/json; charset=utf-8" `
    -InFile request.json `
    -Uri "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/imagegeneration@006:predict" | Select-Object -Expand Content

Die Antwort, die Sie erhalten, hängt von den von Ihnen festgelegten Sicherheitseinstellungen ab. Weitere Informationen finden Sie unter Verantwortungsbewusste KI für Imagen verstehen und konfigurieren.

Prompt-Optimierung mit dem Prompt-Umschreiber

Verfügbarkeit der Funktion: Diese Funktion ist nur für die Modellversion 002 (imagen-3.0-generate-002) von Imagen 3 verfügbar.

Die Modellversion 002 von Imagen 3 enthält eine Funktion zum Umschreiben von Prompts, die ein LLM-basiertes Tool zum Umschreiben von Prompts verwendet. Mit diesem Tool werden dem bereitgestellten Prompt in der Regel mehr Details hinzugefügt, um Bilder mit höherer Qualität zu liefern, die den bereitgestellten Prompt besser widerspiegeln. Wenn Sie diese Funktion deaktivieren, kann sich das auf die Qualität und die zeitnahe Zustellung der Bilder auswirken. Diese Funktion ist standardmäßig aktiviert.

Der umgeschriebene Prompt wird nur über die API-Antwort gesendet, wenn der ursprüngliche Prompt weniger als 30 Wörter lang ist.

Console

Öffnen Sie in der Google Cloud Console den Tab Vertex AI Studio > Medien im Vertex AI-Dashboard.

Zum Tab Vertex AI Studio
Fügen Sie den Textprompt hinzu und wählen Sie die Eingabeparameter aus.
Verwenden Sie im Bereich Parameter die Option toggle_onPrompt-Optimierung aktivieren, um die Prompt-Optimierung zu aktivieren oder zu deaktivieren.
Klicken Sie auf Erstellen.

REST

Weitere Informationen zu imagegeneration-Modellanfragen finden Sie in der API-Referenz des imagegeneration-Modells.

Ersetzen Sie diese Werte in den folgenden Anfragedaten:

PROJECT_ID: Ihre Google Cloud Projekt-ID.
MODEL_VERSION: Die zu verwendende Modellversion für die Bildgenerierung. Verfügbare Werte, die die Prompt-Optimierung unterstützen:
- imagen-3.0-generate-002
Weitere Informationen zu Modellversionen und -features finden Sie unter Modellversionen.
LOCATION: Die Region Ihres Projekts. Beispiel: us-central1, europe-west2 oder asia-northeast3. Eine Liste der verfügbaren Regionen finden Sie unter Generative AI an Vertex AI-Standorten.
TEXT_PROMPT: Der Text-Prompt, der bestimmt, welche Bilder das Modell generiert. Bevor Bilder generiert werden, wird dieser Basisprompt mithilfe des LLM-basierten Tools zum Umschreiben von Prompts um mehr Details und beschreibende Sprache ergänzt.
IMAGE_COUNT ist die Anzahl der generierten Bilder. Zulässige Ganzzahlwerte: 1–4. Standardwert: 4
enhancePrompt: Ein boolescher Wert, mit dem die LLM-basierte Prompt-Optimierung aktiviert wird. Standardmäßig ist dieser Wert auf true festgelegt.

HTTP-Methode und URL:

POST https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/MODEL_VERSION:predict

JSON-Text der Anfrage:

{
  "instances": [
    {
      "prompt": "TEXT_PROMPT"
    }
  ],
  "parameters": {
    "sampleCount": IMAGE_COUNT,
    "enhancePrompt": true
  }
}

Wenn Sie die Anfrage senden möchten, wählen Sie eine der folgenden Optionen aus:

curl

Speichern Sie den Anfragetext in einer Datei mit dem Namen request.json und führen Sie den folgenden Befehl aus:

curl -X POST \
     -H "Authorization: Bearer $(gcloud auth print-access-token)" \
     -H "Content-Type: application/json; charset=utf-8" \
     -d @request.json \
     "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/MODEL_VERSION:predict"

PowerShell

Speichern Sie den Anfragetext in einer Datei mit dem Namen request.json und führen Sie den folgenden Befehl aus:

$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }

Invoke-WebRequest `
    -Method POST `
    -Headers $headers `
    -ContentType: "application/json; charset=utf-8" `
    -InFile request.json `
    -Uri "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/MODEL_VERSION:predict" | Select-Object -Expand Content

Wenn die Prompt-Optimierung aktiviert ist, enthält die Antwort ein zusätzliches prompt-Feld mit dem optimierten Prompt und dem zugehörigen generierten Bild:

  {
    "predictions": [
      {
        "mimeType": "MIME_TYPE",
        "prompt": "ENHANCED_PROMPT_1",
        "bytesBase64Encoded": "BASE64_IMG_BYTES_1"
      },
      {
        "mimeType": "MIME_TYPE",
        "prompt": "ENHANCED_PROMPT_2",
        "bytesBase64Encoded": "BASE64_IMG_BYTES_2"
      }
    ]
  }

Die folgende Beispielantwort bezieht sich beispielsweise auf eine Anfrage mit "sampleCount": 2 und "prompt": "A raccoon wearing formal clothes, wearing a top hat. Oil painting in the style of Vincent Van Gogh.". Die Antwort gibt zwei Vorhersageobjekte zurück, jedes mit dem optimierten Prompt und den base64-codierten generierten Bildbyten.

{
  "predictions": [
    {
      "mimeType": "image/png",
      "prompt": "An oil painting in the style of Vincent van Gogh, depicting a raccoon adorned
        in a finely tailored tuxedo, complete with a crisp white shirt and a bow tie. The raccoon
        also sports a classic top hat, perched jauntily on its head. The painting uses thick,
        swirling brushstrokes characteristic of van Gogh, with vibrant hues of blue, yellow, and
        green in the background, contrasting with the dark tones of the raccoon's attire. The light
        source is subtly placed, casting a dramatic shadow of the raccoon's attire onto the surface
        it sits upon, further enhancing the depth and dimensionality of the composition. The
        overall impression is one of a whimsical and sophisticated character, a raccoon elevated to
        a higher class through its formal attire, rendered in van Gogh's iconic style.",
      "bytesBase64Encoded": "BASE64_IMG_BYTES"
    },
    {
      "mimeType": "image/png",
      "prompt": "An oil painting in the style of Vincent van Gogh featuring a raccoon in a
        dapper suit, complete with a black jacket, crisp white shirt, and a black bow tie. The
        raccoon is wearing a black top hat, adding a touch of elegance to its ensemble. The
        painting is rendered with characteristic van Gogh brushwork, utilizing thick, impasto
        strokes of color. The background is a swirl of blues, greens, and yellows, creating a
        vibrant yet slightly chaotic atmosphere that contrasts with the raccoon's formal attire.
        The lighting is dramatic, casting sharp shadows and highlighting the textures of the fabric
        and the raccoon's fur, enhancing the sense of realism within the fantastical scene. The
        composition focuses on the raccoon's proud posture, highlighting the whimsical contrast of
        a wild animal dressed in formal attire, captured in the unique artistic language of van
        Gogh. ",
      "bytesBase64Encoded": "BASE64_IMG_BYTES"
    }
  ]
}

Sprache des Text-Prompts

Mit diesem optionalen Parameter können Sie die Sprache des Eingabetexts für die Bildgenerierung oder die Bildbearbeitung festlegen.

ein aus einem Prompt generiertes Buch auf Hindi — Bild, das aus dem Prompt generiert wurde: ऊपर से देखा गया किताबों का ढेर। सबसे ऊपरी पुस्तक में एक पक्षी का जलरंग चित्रण है। किताब पर VERTEX AI मोटे अक्षरों में लिखा हुआ है ^*

* *Ein Stapel Bücher, der von oben gesehen wird. Das oberste Buch enthält eine Wasserfarbeabbildung von einem Vogel. VERTEX AI ist auf dem Buch fett formatiert*

Ein Bild einer Frau aus einem Prompt auf Koreanisch — Bild, das aus dem Prompt generiert wurde: 어두운 노란색과 청록색으로 이루어진 밝은 색의 옷을입고 귀걸이를 끼고있는 여자 포스트 모던 패션 사진 ^†

† *Frau, die helle Farben trägt, im Stil von dunklem Gelb und dunklem Cyan, mit Ohrringen, postmoderne Modefotografie*

Vorbereitung

Führen Sie die folgenden zusätzlichen Schritte aus, bevor Sie diese Funktion verwenden:

Verwenden Sie den folgenden Befehl, um eine Dienstidentität für Vertex AI zur Verwendung in Ihrem Projekt zu erstellen:
```
gcloud beta services identity create --service=aiplatform.googleapis.com --project=PROJECT_ID
```
Funktionszugriff anfordern. Wenn Sie den Zugriff anfordern möchten, senden Sie eine E-Mail an die Gruppe Google Cloud Trusted Testers Access: GenApp Builder. Verweisen Sie in Ihrer Nachricht auf Mehrsprachige Prompts und geben Sie Ihre Projektnummer an. Der Genehmigungsprozess dauert in der Regel mehrere Stunden.

Sprache des Text-Prompts festlegen

Die folgenden Sprachwerte für Eingabetext-Prompts werden unterstützt:

Chinesisch (vereinfacht) (zh/zh-CN)
Chinesisch (traditionell) (zh-TW)
Englisch (en, Standardwert)
Hindi (hi)
Japanisch (ja)
Koreanisch (ko)
Portugiesisch (pt)
Spanisch (es)

Console

Wenn Ihr Prompt in einer der unterstützten Sprachen vorliegt, erkennt Imagen Ihren Text automatisch und übersetzt ihn und gibt die generierten oder bearbeiteten Bilder zurück.

Wenn Ihr Prompt in einer nicht unterstützten Sprache verfasst ist, verwendet Imagen den Text wörtlich für die Anfrage. Das kann zu unerwarteten Ergebnissen führen.

REST

Weitere Informationen zu imagegeneration-Modellanfragen finden Sie in der API-Referenz des imagegeneration-Modells.

Ersetzen Sie diese Werte in den folgenden Anfragedaten:

PROJECT_ID: Ihre Google Cloud Projekt-ID.
TEXT_PROMPT: Der Text-Prompt, der bestimmt, welche Bilder das Modell generiert. Dieses Feld ist sowohl zum Erstellen als auch zum Bearbeiten erforderlich.
PROMPT_LANGUAGE: String. Optional. Der Sprachcode, der der Sprache des Text-Prompts entspricht. In diesem Beispiel wäre das hi. Verfügbare Werte:
- auto - Automatische Erkennung. Wenn Imagen eine unterstützte Sprache erkennt, wird der Prompt (und optional ein negativer Prompt) ins Englische übersetzt. Wenn die erkannte Sprache nicht unterstützt wird, verwendet Imagen den Eingabetext unverändert. Dies kann zu unerwarteten Ergebnissen führen. Es wird kein Fehlercode zurückgegeben.
- en - Englisch (Standardwert, wenn nicht angegeben)
- es - Spanisch
- hi - Hindi
- ja - Japanisch
- ko - Koreanisch
- pt - Portugiesisch
- zh-TW - Chinesisch (traditionell)
- zh oder zh-CN - Chinesisch (vereinfacht)

HTTP-Methode und URL:

POST https://us-central1-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/us-central1/publishers/google/models/imagegeneration@005:predict

JSON-Text der Anfrage:

{
  "instances": [
    {
      "prompt": "सूर्यास्त के समय एक समुद्र तट। उड़ते पक्षी, हवा में लहराते नारियल के पेड़। लोग समुद्र तट पर सैर का आनंद ले रहे हैं।"
    }
  ],
  "parameters": {
    "language": "PROMPT_LANGUAGE"
  }
}

Wenn Sie die Anfrage senden möchten, wählen Sie eine der folgenden Optionen aus:

curl

Speichern Sie den Anfragetext in einer Datei mit dem Namen request.json und führen Sie den folgenden Befehl aus:

curl -X POST \
     -H "Authorization: Bearer $(gcloud auth print-access-token)" \
     -H "Content-Type: application/json; charset=utf-8" \
     -d @request.json \
     "https://us-central1-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/us-central1/publishers/google/models/imagegeneration@005:predict"

PowerShell

Speichern Sie den Anfragetext in einer Datei mit dem Namen request.json und führen Sie den folgenden Befehl aus:

$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }

Invoke-WebRequest `
    -Method POST `
    -Headers $headers `
    -ContentType: "application/json; charset=utf-8" `
    -InFile request.json `
    -Uri "https://us-central1-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/us-central1/publishers/google/models/imagegeneration@005:predict" | Select-Object -Expand Content

Die folgende Beispielantwort bezieht sich auf eine Anfrage mit "sampleCount": 2. Die Antwort gibt zwei Vorhersageobjekte zurück, wobei die generierten Bildbyte base64-codiert sind.

{
  "predictions": [
    {
      "bytesBase64Encoded": "BASE64_IMG_BYTES",
      "mimeType": "image/png"
    },
    {
      "mimeType": "image/png",
      "bytesBase64Encoded": "BASE64_IMG_BYTES"
    }
  ]
}

Seitenverhältnis

Je nachdem, wie Sie die generierten Bilder verwenden möchten, eignen sich manche Seitenverhältnisse besser als andere. Wählen Sie das Seitenverhältnis aus, das am besten zu Ihrem Anwendungsfall passt.

Unterstützte Seitenverhältnisse und ihre beabsichtigte Verwendung:

Seitenverhältnis	Verwendungszweck	Bildauflösung (Pixel)	Beispielbild
`1:1`	standard, quadrat, allgemeine Verwendung	1024 × 1024 (Imagen v.002) 1536 × 1536 (Imagen 2 v.005, v.006) 1024 × 1024 (Imagen 3)	^{Eingabeaufforderung:Luftaufnahme eines Pasta-Dinners, Studiofoto im Stil des Food-Magazincovers “}
`3:4`	Fernsehen, Medien, Film	1344 × 1792 (Imagen 2 v.006) 896 × 1280 (Imagen 3)	^{Prompt: Kommerzielle Fotoaufnahme, Duftanzeige, Duftflasche mit Lavendel-Vanille auf einem hellen Hintergrund.}
`4:3`	Fernsehen, Medien, Film	1792 × 1344 (Imagen 2, Version 006) 1280 × 896 (Imagen 3)	^{Prompt: Kommerzielle Fotoaufnahme, grüne und graue High-Top-Sneaker, 4-k, dramatische Winkel}
`9:16`	Hochformat, hohe Objekte, Mobilgeräte	1134 × 2016 (Imagen 2 v.005, v.006) 768 × 1408 (Imagen 3)	^{Eingabeaufforderung: Wolkenkratzer in New York City, futuristisches Rendering, Konzept, digitale Kunst}
`16:9`	Landschaft	2016 × 1134 (Imagen 2, Version 006) 1408 × 768 (Imagen 3)	^{Prompt: Naturfoto, ein Strand auf Hawaii mit dem Meer im Hintergrund, Lichtreflexion, Sonnenuntergang.}

Console

Folgen Sie der Anleitung unter Bild mit Text generieren, um Vertex AI Studio zu öffnen und Ihren Prompt einzugeben.
Wählen Sie im Bereich Parameter im Menü Seitenverhältnis ein Seitenverhältnis aus.
Klicken Sie auf Erstellen.

REST

Das Seitenverhältnis ist ein optionales Feld im parameters-Objekt eines JSON-Anfragetexts.

Folgen Sie der Anleitung unter Bild mit Text generieren, um andere Anfragetextvariablen zu ersetzen.
Ersetzen Sie Folgendes:
- ASPECT_RATIO: String. Optional. Ein Parameter für den Generierungsmodus, der das Seitenverhältnis steuert. Unterstützte Seitenverhältniswerte und ihre beabsichtigte Verwendung:
  - 1:1 (Standard, Quadrat)
  - 3:4 (Werbung, soziale Medien)
  - 4:3 (Fernsehen, Fotografie)
  - 16:9 (Querformat)
  - 9:16 Hochformat
```
{
  "instances": [
    ...
  ],
  "parameters": {
    "sampleCount": IMAGE_COUNT,
    "aspectRatio": "ASPECT_RATIO"
  }
}
```
Folgen Sie der Anleitung unter Bild mit Text generieren, um Ihre REST-Anfrage zu senden.

Anzahl der Ergebnisse

Verwenden Sie die Anzahl der Ergebnisparameter, um die Anzahl der Bilder zu begrenzen, die pro gesendete Anfrage (generiert oder bearbeitet) zurückgegeben werden.

Console

Folgen Sie der Anleitung unter Bild mit Text generieren, um Vertex AI Studio zu öffnen und Ihren Prompt einzugeben.
Wählen Sie im Bereich Parameter im Feld Anzahl der Ergebnisse eine gültige Ganzzahl aus.
Klicken Sie auf Erstellen.

REST

Weitere Informationen zu imagegeneration-Modellanfragen finden Sie in der API-Referenz des imagegeneration-Modells.

Die Anzahl der Ergebnisse ist ein Feld im parameters-Objekt eines JSON-Anfragetexts.

Folgen Sie der Anleitung unter Bild mit Text generieren, um andere Anfragetextvariablen zu ersetzen.
Ersetzen Sie Folgendes:
- IMAGE_COUNT ist die Anzahl der generierten Bilder. Zulässige Ganzzahlwerte: 1–8 (imagegeneration@002), 1–4 (alle anderen Modellversionen). Standardwert: 4
```
{
  "instances": [
    ...
  ],
  "parameters": { 
    "sampleCount": IMAGE_COUNT
  }
}
```
Folgen Sie der Anleitung unter Bild mit Text generieren, um Ihre REST-Anfrage zu senden.

Negativer Prompt

Ein Negativ-Prompt ist eine Beschreibung dessen, was Sie in generierten Bildern auslassen möchten. Sehen Sie sich zum Beispiel den Prompt eine verregnete Stadt nachts ohne Personen an. Das Modell könnte "Personen" als Anweisung dafür verwenden, was eingeschlossen werden soll, statt als was weggelassen werden soll. Wenn Sie bessere Ergebnisse erzielen möchten, können Sie den Prompt Verregnete Stadt in der Nacht mit einem negativen Prompt Personen verwenden.

Imagen erstellt diese Bilder mit und ohne negativen Prompt:

Nur-Text-Prompt

Text-Prompt: eine Pizza

drei Beispielbilder für Pizza

Text-Prompt und negativer Prompt

Text-Prompt: eine Pizza
Negativer Prompt: Salami

drei Beispielbilder für Pizza ohne Salami

Console

Folgen Sie der Anleitung unter Bild mit Text generieren, um Vertex AI Studio zu öffnen und Ihren Prompt einzugeben.
Geben Sie im Bereich Parameter in das Feld Negativer Prompt einen negativen Prompt ein.
Klicken Sie auf Erstellen.

REST

Weitere Informationen zu imagegeneration-Modellanfragen finden Sie in der API-Referenz des imagegeneration-Modells.

Eine negativer Prompt ist ein optionales Feld im Objekt parameters eines JSON-Anfragetexts.

Folgen Sie der Anleitung unter Bild mit Text generieren, um andere Anfragetextvariablen zu ersetzen.
Ersetzen Sie Folgendes:
- NEGATIVE_PROMPT: Ein negativer Prompt, der bei der Bildgenerierung helfen soll. Zum Beispiel: "Tiere" (Tiere entfernen), "unschärfe" (das Bild wird klarer gemacht), "Text" (entfernt Text) oder "zuschneiden" (entfernt zugeschnittene Bilder).
```
{
  "instances": [
    ...
  ],
  "parameters": {
    "sampleCount": IMAGE_COUNT,
    "negativePrompt": "NEGATIVE_PROMPT"
  }
}
```
Folgen Sie der Anleitung unter Bild mit Text generieren, um Ihre REST-Anfrage zu senden.

Quell-Nummer

Eine Quell-Nummer ist eine Zahl, die Sie einer Anfrage hinzufügen, um generierte Bilder deterministisch zu machen. Durch Hinzufügen einer Quell-Nummer zu Ihrer Anfrage können Sie sicher sein, dass Sie jedes Mal dieselben generierten Bilder erhalten. Sie können beispielsweise einen Prompt angeben, die Anzahl der Ergebnisse auf 1 setzen und eine Quell-Nummer verwenden, um jedes Mal, wenn Sie dieselben Eingabewerte verwenden, dasselbe Bild zu erhalten. Wenn Sie dieselbe Anfrage mit der Anzahl der Ergebnisse auf 8 gesetzt senden, erhalten Sie dieselben acht Bilder. Die Antworten werden jedoch nicht unbedingt in derselben Reihenfolge zurückgegeben.

Console

Folgen Sie der Anleitung unter Bild mit Text generieren, um Vertex AI Studio zu öffnen und Ihren Prompt einzugeben.
Klicken Sie im Bereich Parameter auf den ausklappbaren Bereich Erweiterte Optionen.
Geben Sie in das Feld Quelle eine Quell-Nummer ein.
Klicken Sie auf Erstellen.

REST

Weitere Informationen zu imagegeneration-Modellanfragen finden Sie in der API-Referenz des imagegeneration-Modells.

Die Quell-Nummer ist ein optionales Feld im parameters-Objekt eines JSON-Anfragetexts.

Folgen Sie der Anleitung unter Bild mit Text generieren, um andere Anfragetextvariablen zu ersetzen.
Ersetzen Sie Folgendes:
- SEED_NUMBER: Ganzzahl. Optional. Jede nicht negative Ganzzahl, die Sie angeben, um Ausgabebilder deterministisch zu machen. Die Angabe derselben Quell-Nummer führt immer zu denselben Ausgabebildern. Wenn das von dir verwendete Modell digitale Wasserzeichen unterstützt, musst du "addWatermark": false festlegen, um dieses Feld zu verwenden. Zulässige Ganzzahlwerte: 1–2147483647.
```
{
  "instances": [
    ...
  ],
  "parameters": {
    "sampleCount": IMAGE_COUNT,
    "seed": SEED_NUMBER,
    // required for model version 006 and greater only when using a seed number
    "addWatermark": false
  }
}
```
Folgen Sie der Anleitung unter Bild mit Text generieren, um Ihre REST-Anfrage zu senden.

Vordefinierter Stil

Verfügbarkeit der Funktion:Diese Funktion ist nur für die Modellversion 002 (imagegeneration@002) verfügbar.

Der Stil des Bildes, das Sie generieren möchten. Mit dieser Funktion können Sie Bilder in beliebten Stilen erstellen, wie z. B. digitale Kunst, Wasserfarbe oder Cyberpunk.

Console

Folgen Sie der Anleitung unter Bild mit Text generieren, um Vertex AI Studio zu öffnen und Ihren Prompt einzugeben.
Wählen Sie im Bereich Stil des Bereichs Parameter einen Stil aus dem Menü aus.
Klicken Sie auf Erstellen.

REST

Weitere Informationen zu imagegeneration-Modellanfragen finden Sie in der API-Referenz des imagegeneration-Modells.

Der vordefinierte Stil ist ein optionales Feld im parameters-Objekt eines JSON-Anfragetexts.

Folgen Sie der Anleitung unter Bild mit Text generieren, um andere Anfragetextvariablen zu ersetzen.

Ersetzen Sie Folgendes:

IMAGE_STYLE: Einen der verfügbaren vordefinierten Stile:
- photograph
- digital_art
- landscape
- sketch
- watercolor
- cyberpunk
- pop_art

{
  "instances": [
    ...
  ],
  "parameters": {
    "sampleCount": IMAGE_COUNT,
    "sampleImageStyle": "IMAGE_STYLE"
  }
}

Folgen Sie der Anleitung unter Bild mit Text generieren, um Ihre REST-Anfrage zu senden.

Bild optimieren

Verwenden Sie die Hochskalierung, um die Größe vorhandener, generierter oder bearbeiteter Bilder zu erhöhen, ohne die Qualität zu beeinträchtigen.

Console

Folgen Sie der Anleitung unter Bild mit Text generieren, um Bilder zu generieren.
Wählen Sie das Bild aus, das hochskaliert werden soll.
Klicken Sie auf Exportieren.
Wählen Sie Bilder hochskalieren.
Wählen Sie einen Wert aus dem Skalierungsfaktor.
Klicken Sie auf Exportieren, um das hochskalierte Bild zu speichern.

REST

Weitere Informationen zu imagegeneration-Modellanfragen finden Sie in der API-Referenz des imagegeneration-Modells.

Der Hochskalierungsmodus ist ein optionales Feld im parameters-Objekt eines JSON-Anfragetexts. Wenn Sie ein Bild mit der API aktualisieren, geben Sie "mode": "upscale" und upscaleConfig an.

Ersetzen Sie diese Werte in den folgenden Anfragedaten:

LOCATION: Die Region Ihres Projekts. Beispiel: us-central1, europe-west2 oder asia-northeast3. Eine Liste der verfügbaren Regionen finden Sie unter Generative AI an Vertex AI-Standorten.
PROJECT_ID: Ihre Google Cloud Projekt-ID.
B64_BASE_IMAGE: Das Basisbild, das bearbeitet oder hochskaliert werden soll. Das Bild muss als base64-codierter Bytestring angegeben werden. Größenbeschränkung: 10 MB.
IMAGE_SOURCE: Der Cloud Storage-Speicherort des Bildes, das Sie bearbeiten oder hochskalieren möchten. Beispiel: gs://output-bucket/source-photos/photo.png
UPSCALE_FACTOR: Optional. Der Faktor, auf den das Bild hochskaliert werden soll. Wenn nicht angegeben, wird der Hochskalierungsfaktor von der längeren Seite des Eingabebilds und von sampleImageSize bestimmt. Verfügbare Werte: x2 oder x4.

HTTP-Methode und URL:

POST https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/imagegeneration@002:predict

JSON-Text der Anfrage:

{
  "instances": [
    {
      "prompt": "",
      "image": {
        // use one of the following to specify the image to upscale
        "bytesBase64Encoded": "B64_BASE_IMAGE"
        "gcsUri": "IMAGE_SOURCE"
        // end of base image input options
      },
    }
  ],
  "parameters": {
    "sampleCount": 1,
    "mode": "upscale",
    "upscaleConfig": {
      "upscaleFactor": "UPSCALE_FACTOR"
    }
  }
}

Wenn Sie die Anfrage senden möchten, wählen Sie eine der folgenden Optionen aus:

curl

Speichern Sie den Anfragetext in einer Datei mit dem Namen request.json und führen Sie den folgenden Befehl aus:

curl -X POST \
     -H "Authorization: Bearer $(gcloud auth print-access-token)" \
     -H "Content-Type: application/json; charset=utf-8" \
     -d @request.json \
     "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/imagegeneration@002:predict"

PowerShell

Speichern Sie den Anfragetext in einer Datei mit dem Namen request.json und führen Sie den folgenden Befehl aus:

$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }

Invoke-WebRequest `
    -Method POST `
    -Headers $headers `
    -ContentType: "application/json; charset=utf-8" `
    -InFile request.json `
    -Uri "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/imagegeneration@002:predict" | Select-Object -Expand Content

Sie sollten in etwa folgende JSON-Antwort erhalten:

{
  "predictions": [
    {
      "mimeType": "image/png",
      "bytesBase64Encoded": "iVBOR..[base64-encoded-upscaled-image]...YII="
    }
  ]
}

Nächste Schritte

Artikel zu Imagen und anderen Produkten für generative KI in Vertex AI:

Zurück

Leitfaden zu Prompt- und Bildattributen

Weiter

Bilder erstellen