Diese Seite wurde von der Cloud Translation API übersetzt.

Bilder mit Gemini bearbeiten

Achtung: Die Bildgenerierung mit Gemini 2.0 Flash wird am 26. September 2025 eingestellt. gemini-2.0-flash-preview-image-generation wird am 26. September 2025 entfernt. Migrieren Sie alle Arbeitsabläufe zu gemini-2.5-flash-image-preview.

Vorschau

Dieses Produkt oder Feature ist ein Angebot für eine Vorschau der generativen KI, das den „Nutzungsbedingungen des Pre-GA-Angebots“ der besonderen Nutzungsbedingungen von Google Cloud sowie den zusätzlichen Bedingungen für Vorschauprodukte der generativen KI unterliegt. Für dieses Angebot zur Vorschau generativer KI können Kunden es für Produktions- oder kommerzielle Zwecke verwenden oder generierte Ausgaben an Dritte weitergeben und personenbezogene Daten gemäß dem Zusatz zur Verarbeitung von Cloud-Daten verarbeiten, vorbehaltlich der in der Vereinbarung beschriebenen Verpflichtungen und Einschränkungen, gemäß der Sie auf Google Cloud zugreifen. Pre-GA-Produkte sind „wie gesehen“ verfügbar und bieten möglicherweise nur eingeschränkten Support. Weitere Informationen finden Sie unter Beschreibungen der Startphase.

Gemini 2.5 Flash Image Preview unterstützt verschiedene Arten der Bildbearbeitung.

Bildbearbeitung

Die öffentliche Vorschau von Gemini 2.5 Flash Image für die Bildgenerierung (gemini-2.5-flash-image-preview) unterstützt die Möglichkeit, Bilder zu bearbeiten und zu generieren. Mit dieser öffentlichen Vorabversion unterstützt Gemini 2.5 Flash Image eine verbesserte Bearbeitung von Bildern und die Bearbeitung in mehreren Schritten. Außerdem enthält sie aktualisierte Sicherheitsfilter, die eine flexiblere und weniger restriktive Nutzung ermöglichen.

Er unterstützt die folgenden Modalitäten und Funktionen:

Bildbearbeitung (Text-zu-Bild und Bild-zu-Bild)
- Beispiel-Prompt: „Bearbeite dieses Bild so, dass es wie ein Cartoon aussieht.“
- Beispiel-Prompt: [Bild einer Katze] + [Bild eines Kissens] + „Erstelle ein Kreuzstichmuster meiner Katze auf diesem Kissen.“
Bildbearbeitung mit mehreren Antworten (Chat)
- Beispiel-Prompts: [Lade ein Bild eines blauen Autos hoch.] „Mach aus diesem Auto ein Cabrio.“ „Ändere die Farbe jetzt in Gelb.“ „Füge einen Spoiler hinzu.“

Bild bearbeiten

Konsole

So bearbeiten Sie Bilder:

Öffnen Sie Vertex AI Studio > Prompt erstellen.
Klicken Sie auf Modell wechseln und wählen Sie im Menü gemini-2.5-flash-image-preview aus.
Wählen Sie im Bereich Ausgaben im Drop-down-Menü die Option Bild und Text aus.
Klicken Sie auf Medien einfügen () und wählen Sie eine Quelle aus dem Menü aus. Folgen Sie dann der Anleitung im Dialogfeld.
Geben Sie im Textbereich Prompt schreiben ein, welche Änderungen Sie am Bild vornehmen möchten.
Klicken Sie auf die Schaltfläche Prompt ().

Gemini generiert anhand Ihrer Beschreibung eine bearbeitete Version des bereitgestellten Bildes. Dieser Vorgang sollte einige Sekunden dauern, kann aber je nach Kapazität vergleichsweise länger dauern.

Python

Installieren

pip install --upgrade google-genai

Weitere Informationen finden Sie in der SDK-Referenzdokumentation.

Umgebungsvariablen für die Verwendung des Gen AI SDK mit Vertex AI festlegen:

# Replace the `GOOGLE_CLOUD_PROJECT` and `GOOGLE_CLOUD_LOCATION` values
# with appropriate values for your project.
export GOOGLE_CLOUD_PROJECT=GOOGLE_CLOUD_PROJECT
export GOOGLE_CLOUD_LOCATION=global
export GOOGLE_GENAI_USE_VERTEXAI=True

from google import genai
from google.genai.types import GenerateContentConfig, Modality
from PIL import Image
from io import BytesIO

client = genai.Client()

# Using an image of Eiffel tower, with fireworks in the background.
image = Image.open("test_resources/example-image-eiffel-tower.png")

response = client.models.generate_content(
    model="gemini-2.5-flash-image-preview",
    contents=[image, "Edit this image to make it look like a cartoon."],
    config=GenerateContentConfig(response_modalities=[Modality.TEXT, Modality.IMAGE]),
)
for part in response.candidates[0].content.parts:
    if part.text:
        print(part.text)
    elif part.inline_data:
        image = Image.open(BytesIO((part.inline_data.data)))
        image.save("output_folder/bw-example-image.png")
# Example response:
#  Here's the cartoon-style edit of the image:
#  Cartoon-style edit:
#  - Simplified the Eiffel Tower with bolder lines and slightly exaggerated proportions.
#  - Brightened and saturated the colors of the sky, fireworks, and foliage for a more vibrant, cartoonish look.
#  ....

REST

Führen Sie den folgenden Befehl im Terminal aus, um diese Datei im aktuellen Verzeichnis zu erstellen oder zu überschreiben:

curl -X POST \
  -H "Authorization: Bearer $(gcloud auth print-access-token)" \
  -H "Content-Type: application/json" \
  https://${API_ENDPOINT}:generateContent \
  -d '{
    "contents": {
      "role": "USER",
      "parts": [
        {"file_data": {
          "mime_type": "image/jpg",
          "file_uri": "<var>FILE_NAME</var>"
          }
        },
        {"text": "Convert this photo to black and white, in a cartoonish style."},
      ]

    },
    "generation_config": {
      "response_modalities": ["TEXT", "IMAGE"],
    },
    "safetySettings": {
      "method": "PROBABILITY",
      "category": "HARM_CATEGORY_DANGEROUS_CONTENT",
      "threshold": "BLOCK_MEDIUM_AND_ABOVE"
    },
  }' 2>/dev/null >response.json

Hinweis:Sie müssen> responseModalities: ["TEXT", "IMAGE"] in Ihre Konfiguration aufnehmen. Die reine Bildausgabe wird bei diesen Modellen nicht unterstützt.

Gemini generiert ein Bild basierend auf Ihrer Beschreibung. Dieser Vorgang sollte einige Sekunden dauern, kann aber je nach Kapazität vergleichsweise langsam sein.

Multi-Turn-Bildbearbeitung

Gemini 2.5 Flash Image Preview unterstützt auch die verbesserte Bearbeitung in mehreren Schritten. Sie können also auf die Antwort des Modells mit Änderungen reagieren, nachdem Sie ein bearbeitetes Bild erhalten haben. So können Sie weiterhin Änderungen am Bild vornehmen.

Die Gesamtgröße der Anfragedatei sollte maximal 50 MB betragen.

Wenn Sie die Bildbearbeitung in mehreren Schritten ausprobieren möchten, können Sie unser Gemini 2.5 Flash Image Preview-Notebook verwenden.

Bilder mit Gemini bearbeiten Mit Sammlungen den Überblick behalten Sie können Inhalte basierend auf Ihren Einstellungen speichern und kategorisieren.

Bildbearbeitung

Bild bearbeiten

Konsole

Python

Installieren

REST

Multi-Turn-Bildbearbeitung

Bilder mit Gemini bearbeiten