Text-zu-Bild-KI

Bilder aus Text erstellen, ohne eine einzige Codezeile schreiben zu müssen

Mit der KI-gestützten Bildgenerierung von Google Cloud und den Programmiersprachen Python, Java und Go können Sie in Sekundenschnelle Bilder aus Textbeschreibungen generieren. 

Neukunden erhalten ein Guthaben von bis zu 300 $, um mit Imagen in Vertex AI Bilder und mehr zu generieren. 

Überblick

Was ist Text-zu-Bild-KI?

Text-zu-Bild-KI ist eine Art künstlicher Intelligenz, die Bilder aus Textbeschreibungen generieren kann. Diese Technologie hat das Potenzial, die Art und Weise zu verändern, wie wir mit visuellen Inhalten interagieren und diese erstellen. Google Cloud-Tools und -Ressourcen für die Text-zu-KI, darunter vortrainierte KI-Modelle wie Imagen, Parti und Muse, die in Vertex AI verfügbar sind, sollen Entwicklern dabei helfen, die Generierung von Text zu Bildern zu vereinfachen. in ihren Anwendungen. Und mit AutoML können Sie KI-Modelle für fachspezifische Anwendungen anpassen.

Wie wird Text-zu-Bild bei der Anwendungsentwicklung verwendet?

Text-zu-Bild-KI kann in der Anwendungsentwicklung verwendet werden, um Modelle, Prototypen, Illustrationen, Testdaten, Lerninhalte und Visualisierungen für die Fehlerbehebung zu generieren. Mit Vertex AI und Cloud Vision API von Google Cloud erhalten Entwickler Zugriff auf eine Reihe von Bildverarbeitungsfunktionen, darunter Texterkennung, Objekterkennung und Bildklassifizierung.Mit Document AI können Sie Text aus gescannten Dokumenten extrahieren, um Bilder für Textbeschreibungen zu generieren.

Welche Modelle werden für die Generierung von Texten zu Bildern verwendet?

Imagen, Parti und Muse sind wichtige Text-zu-Bild-Modelle. Imagen ist ein Diffusionsmodell mit einem hohen Grad an Fotorealismus. Das Pathways Autoregressive Text-to-Image-Modell (Parti) unterstützt die inhaltsreiche Synthese mit komplexen Kompositionen und Weltwissen. Muse ist ein Transformer-Modell für eine hohe Bildgenerierungsleistung. Und Gemini erweitert die Möglichkeiten durch ein Modell, das praktisch jede Eingabe verstehen und fast jede Ausgabe generieren kann – einschließlich Text, Bilder, Audio, Video und Code.

Wie unterscheiden sich diese Modelle?

Imagen, ein Diffusionsmodell, eignet sich hervorragend für Fotorealismus mit einem ausgeprägten Sprachverständnis. Parti, ein autoregressives Modell, eignet sich hervorragend für einen einheitlichen Stil und ein einheitliches Design und die Erzeugung von Bildern in einem bestimmten Stil. Muse, ein Transformer-Modell, kann Bilder mit mehreren Objekten und komplexen Kompositionen generieren. Jede dieser Tools hat einzigartige Stärken: Imagen zeichnet sich durch Fotorealismus, Parti in Rich-Content und Muse in den Geschwindigkeits- und Bearbeitungstools aus. Alle sind einfach zu bedienen und erfordern keine Programmierkenntnisse.

Was ist Imagen 3?

Imagen 3 ist das neueste Modell zur Bildgenerierung von Google. Es bietet eine herausragende Bildqualität sowie mehrere Verbesserungen gegenüber Imagen 2 – darunter eine um 40% schnellere Generierung für schnelles Prototyping und Iteration; Besseres zügiges Verständnis und das Folgen von Anweisungen; fotorealistische Generationen, einschließlich Personengruppen; und mehr Kontrolle über die Textdarstellung in einem Bild.

Imagen 3 ist für Vertex AI-Kunden mit Early Access als Vorabversion verfügbar. Es bietet außerdem Unterstützung in mehreren Sprachen, integrierte Sicherheitsfunktionen wie digitale Wasserzeichen von Google DeepMind SynthID und Unterstützung mehrerer Seitenverhältnisse.

Wie kann ich diese Google-Modelle verwenden?

Sie können über Vertex AI in Google Cloud oder über einen API-Drittanbieter auf diese Text-zu-Bild-KI-Modelle zugreifen.Um die Modelle zu verwenden, geben Sie einfach einen Text-Prompt an, wählen Parameter aus (bei einigen Modellen können Sie Parameter auswählen, die den Stil, die Kreativität und die Genauigkeit des generierten Bildes steuern) und schließlich das Bild generieren. 

Funktionsweise

Text-zu-Bild-KI wandelt die Textbeschreibung mithilfe von Natural Language Processing (NLP) in ein maschinenlesbares Format um. Nach der Konvertierung in ein maschinell lesbares Format wird das Modell für maschinelles Lernen mit einem riesigen Datensatz aus Text und Bildern trainiert, es lernt, Muster zu erkennen und damit neue Bilder zu generieren. Die Text-zu-Bild-KI von Google Cloud verwendet ein Deep-Learning-Modell namens Imagen. Mit diesem hochmodernen Modell lassen sich aus Textbeschreibungen fotorealistische Bilder generieren.

Produkt-UI für generative KI
Bilder mit Vertex AI Studio generieren und bearbeiten

Gängige Einsatzmöglichkeiten

Mit KI Bilder generieren

Bilder mithilfe von Text-Prompts erstellen

Erfahren Sie, wie Sie das Feature zur Text-zu-Bild-Generierung von Imagen in Vertex AI verwenden und eine erweiterte Version eines generierten Bildes exportieren. In dieser Kurzanleitung erfahren Sie, wie Sie die Bildgenerierung von Imagen in der Google Cloud Console verwenden.

Jetzt starten
Generiertes Bild eines Hundes, der in Vertex AI eine Zeitung liest

Bilder mithilfe von Text-Prompts erstellen

Erfahren Sie, wie Sie das Feature zur Text-zu-Bild-Generierung von Imagen in Vertex AI verwenden und eine erweiterte Version eines generierten Bildes exportieren. In dieser Kurzanleitung erfahren Sie, wie Sie die Bildgenerierung von Imagen in der Google Cloud Console verwenden.

Jetzt starten
Generiertes Bild eines Hundes, der in Vertex AI eine Zeitung liest

Bildbearbeitung mit KI

Bilder mit Text-Prompts bearbeiten

Mit Imagen können Sie generierte oder vorhandene Bilder bearbeiten. Sie können einen Text-Prompt verwenden, um das gesamte Bild zu aktualisieren (maskenfreie Bearbeitung), oder Sie geben zusätzlich zur Textbeschreibung der Aktualisierungen einen Teil des Bildes an (maskenbasierte Bearbeitung).

Bilder mit Text-Prompts bearbeiten
Bildbearbeitung in Vertex AI

Bilder mit Text-Prompts bearbeiten

Mit Imagen können Sie generierte oder vorhandene Bilder bearbeiten. Sie können einen Text-Prompt verwenden, um das gesamte Bild zu aktualisieren (maskenfreie Bearbeitung), oder Sie geben zusätzlich zur Textbeschreibung der Aktualisierungen einen Teil des Bildes an (maskenbasierte Bearbeitung).

Bilder mit Text-Prompts bearbeiten
Bildbearbeitung in Vertex AI

Visuelle Untertitel mit KI

Bildbeschreibungen mit der visuellen Untertitelung abrufen

Erstellen Sie relevante Beschreibungen für Bilder, einschließlich detaillierter Metadaten, automatischer Untertitel und Kurzbeschreibungen von Produkten und visuellen Assets.

Bildunterschriften für Ihre Bilder erstellen
Benutzeroberfläche von Bilduntertiteln

Bildbeschreibungen mit der visuellen Untertitelung abrufen

Erstellen Sie relevante Beschreibungen für Bilder, einschließlich detaillierter Metadaten, automatischer Untertitel und Kurzbeschreibungen von Produkten und visuellen Assets.

Bildunterschriften für Ihre Bilder erstellen
Benutzeroberfläche von Bilduntertiteln

Proof of Concept starten

Neukunden erhalten ein Guthaben von bis zu 300 $, um in Vertex AI Bilder und mehr zu generieren

Sie haben ein großes Projekt?

Informationen dazu, welche Arten von Bildern Sie erstellen können

Informationen zum Generieren von Bildern mit Text-Prompts

Informationen zum Generieren und Überprüfen von Bildwasserzeichen

Google Cloud
  • ‪English‬
  • ‪Deutsch‬
  • ‪Español‬
  • ‪Español (Latinoamérica)‬
  • ‪Français‬
  • ‪Indonesia‬
  • ‪Italiano‬
  • ‪Português (Brasil)‬
  • ‪简体中文‬
  • ‪繁體中文‬
  • ‪日本語‬
  • ‪한국어‬
Console
Google Cloud