Testen Sie Nano Banana Pro, unser hochmodernes Modell für die Bildgenerierung und ‑bearbeitung – jetzt auf der Gemini Enterprise Agent Platform verfügbar.

Text-zu-Bild-KI

Erstellen und bearbeiten Sie Bilder über Texteingaben, ohne eine einzige Codezeile schreiben zu müssen.

Mit den Bildgenerierungsmodellen Gemini 3 Pro Image und Imagen können Sie in Sekundenschnelle Bilder aus Textbeschreibungen generieren und bearbeiten. APIs sind in den Programmiersprachen Python, Java und Go verfügbar.

Neukunden erhalten ein Guthaben von bis zu 300 $, um Bilder und mehr auf der Gemini Enterprise Agent Platform zu generieren.

Überblick

Was ist Text-zu-Bild-KI?

Eine Text-zu-Bild-KI ist eine Art künstlicher Intelligenz, die Bilder aus Textbeschreibungen generieren und bearbeiten kann. Diese Technologie hat das Potenzial, die Art und Weise, wie wir mit visuellen Inhalten interagieren und sie erstellen, zu verändern. Die Text-zu-Bild-KI von Google Cloud, einschließlich vortrainierter KI-Modelle wie Imagen, Gemini 3 Pro Image und Veo, die in Agent Platform verfügbar sind, wurden entwickelt, um Entwicklern die Implementierung der Text-zu-Bild-Generierung in ihren Anwendungen zu erleichtern.

Beschreibung des Video-Thumbnails

VIDEO

Fragen und Antworten zur Text-zu-Bild-KI

3:23

Wie wird Text-zu-Bild bei der Anwendungsentwicklung verwendet?

KI-Tools zur Text-zu-Bild-Generierung können in der Anwendungsentwicklung eingesetzt werden, um Mockups, Prototypen, Illustrationen, Testdaten, Lerninhalte und Visualisierungen für das Debugging zu erstellen. Die Agent Platform und die Cloud Vision API von Google Cloud bieten Entwicklern Zugriff auf eine Reihe von Bildverarbeitungsfunktionen, darunter Texterkennung, Objekterkennung und Bildklassifizierung. Document AI kann verwendet werden, um Text aus gescannten Dokumenten zu extrahieren und so Textbeschreibungsbilder zu generieren.

Praxisorientierte KI-Anwendungen mit Gemini und Imagen entwickeln:

Kostenloses Training starten

Wie kann ich diese Google-Modelle verwenden?

Sie können über Agent Platform in Google Cloud oder Google AI Studio auf diese KI-Modelle für die Text-zu-Bild-Generierung zugreifen. Um die Modelle zu verwenden, geben Sie einfach einen Text-Prompt ein, wählen Parameter aus (bei einigen Modellen können Sie Parameter wählen, die Stil, Kreativität und Genauigkeit des generierten Bildes steuern) und generieren schließlich das Bild.

Funktionsweise

Die KI für die Text-zu-Bild-Generierung nutzt Natural Language Processing (NLP), um die Textbeschreibung in ein maschinenlesbares Format zu konvertieren. Nach der Konvertierung in ein maschinell lesbares Format wird das Modell für maschinelles Lernen mit einem riesigen Datensatz aus Text und Bildern trainiert, wobei es lernt, Muster zu erkennen und über diese Bilder zu generieren zu bearbeiten.

Produkt-UI für generative KI

Von Text zu Bild: Eine Einführung in die KI-Bildgenerierung

Gängige Einsatzmöglichkeiten

Mit KI Bilder generieren

Bilder mithilfe von Text-Prompts erstellen

Erfahren Sie, wie Sie das Feature zur Text-zu-Bild-Generierung von Imagen in Agent Platform verwenden und eine erweiterte Version eines generierten Bildes exportieren. In dieser Kurzanleitung erfahren Sie, wie Sie die Bildgenerierung von Imagen in der Google Cloud Console verwenden.

Mit Imagen erstellte Bilder

Anleitungen

Bilder mithilfe von Text-Prompts erstellen

Erfahren Sie, wie Sie das Feature zur Text-zu-Bild-Generierung von Imagen in Agent Platform verwenden und eine erweiterte Version eines generierten Bildes exportieren. In dieser Kurzanleitung erfahren Sie, wie Sie die Bildgenerierung von Imagen in der Google Cloud Console verwenden.

Mit Imagen erstellte Bilder

Bildbearbeitung mit KI

Zusammenführen mehrerer Bilder und Bearbeitung per Prompt

Mit Gemini können Sie verschiedene Bilder zu einem neuen, nahtlos wirkenden Bild kombinieren. Sie können mehrere Referenzbilder nutzen, um ein einziges, einheitliches Bild zu erstellen. Außerdem können Sie Bilder mit einfachen Anweisungen in natürlicher Sprache bearbeiten. Ob Sie eine Person aus einem Gruppenfoto entfernen oder ein kleines Detail wie einen Fleck korrigieren möchten – es geht ganz einfach per Sprachbefehl.

Außerdem können Sie mit Imagen auf der Agent Platform von Imagen generierte oder vorhandene Bilder bearbeiten. Sie können den zu bearbeitenden Teil des Bildes und eine Textbeschreibung der Änderungen angeben (maskenbasierte Bearbeitung).

Bearbeitungs-UI von Generative AI Studio

Anleitungen

Zusammenführen mehrerer Bilder und Bearbeitung per Prompt

Mit Gemini können Sie verschiedene Bilder zu einem neuen, nahtlos wirkenden Bild kombinieren. Sie können mehrere Referenzbilder nutzen, um ein einziges, einheitliches Bild zu erstellen. Außerdem können Sie Bilder mit einfachen Anweisungen in natürlicher Sprache bearbeiten. Ob Sie eine Person aus einem Gruppenfoto entfernen oder ein kleines Detail wie einen Fleck korrigieren möchten – es geht ganz einfach per Sprachbefehl.

Außerdem können Sie mit Imagen auf der Agent Platform von Imagen generierte oder vorhandene Bilder bearbeiten. Sie können den zu bearbeitenden Teil des Bildes und eine Textbeschreibung der Änderungen angeben (maskenbasierte Bearbeitung).

Bearbeitungs-UI von Generative AI Studio

Visuelle Untertitel mit KI

Bildbeschreibungen mit der visuellen Untertitelung abrufen

Relevante Beschreibungen für Bilder erstellen, einschließlich detaillierter Metadaten, automatisierter Untertitel und kurzer Beschreibungen von Produkten und visuellen Assets.

Benutzeroberfläche von Bilduntertiteln

Anleitungen

Bildbeschreibungen mit der visuellen Untertitelung abrufen

Relevante Beschreibungen für Bilder erstellen, einschließlich detaillierter Metadaten, automatisierter Untertitel und kurzer Beschreibungen von Produkten und visuellen Assets.

Benutzeroberfläche von Bilduntertiteln

Proof of Concept starten

Neukunden erhalten ein Startguthaben von bis zu 300 $, mit dem sie Bilder und mehr in der Agent Platform generieren können.

Sie haben ein großes Projekt?

Informationen zu den verschiedenen Arten von Bildern, die Sie erstellen können

Bilder mithilfe von Text-Prompts erstellen

Imagen in Colab ausprobieren

Beschleunigen Sie Ihre digitale Transformation
Ganz gleich, ob Ihr Unternehmen erst am Anfang seines Wegs der digitalen Transformation steht oder schon einiges erreicht hat – Google Cloud unterstützt Sie dabei, Ihre größten Herausforderungen zu bewältigen.
Weitere Informationen

Branchenlösungen
Kosten senken, operative Agilität steigern und neue Marktchancen nutzen
Alle Branchenlösungen ansehen

Google Cloud-Produkte
Lernen Sie über 100 Produkte kennen. Neukunden erhalten ein Guthaben von 300 $, um Arbeitslasten auszuführen, zu testen und bereitzustellen. Alle Kunden können innerhalb der monatlichen Nutzungslimits mehr als 25 Produkte kostenlos nutzen.
Alle Produkte ansehen (über 100)

Sparen Sie Geld mit unserem transparenten Preisansatz
„Pay-as-you-go“-Preise von Google Cloud bieten automatische Einsparungen basierend auf der monatlichen Nutzung und ermäßigten Preisen für Prepaid-Ressourcen Kontaktieren Sie uns, um ein Angebot zu erhalten.
Angebot anfordern

Produktspezifische Preisangaben
Compute Engine
Cloud SQL
Google Kubernetes Engine
Cloud Storage
BigQuery
Vollständige Preisliste mit über 100 Produkten anzeigen

Beschleunigen Sie Ihre digitale Transformation
Weitere Informationen
Hauptvorteile
Vorteile von Google Cloud
KI und KI-Agenten
Multi-Cloud
Globale Infrastruktur
Daten-Cloud
Moderne Infrastruktur-Cloud
Sicherheit
Produktivität und Zusammenarbeit
Berichte und Statistiken
Statistiken für Führungskräfte
Analystenberichte
Whitepaper
Kundenberichte

Sparen Sie Geld mit unserem transparenten Preisansatz
Angebot anfordern
Preisübersicht und Tools
Google Cloud-Preise
Preisrechner
Kostenlose Stufe von Google Cloud
Framework zur Kostenoptimierung
Tools zur Kostenverwaltung
Produktspezifische Preisangaben
Compute Engine
Cloud SQL
Google Kubernetes Engine
Cloud Storage
BigQuery
Vollständige Preisliste mit über 100 Produkten anzeigen