Google Cloud bietet eine Reihe von Produkten und Tools zum Erstellen generativer KI-Anwendungen mit Skalierung, Sicherheit und Beobachtbarkeit auf Unternehmensniveau.

Auf dieser Seite erfahren Sie mehr über die Phasen der Entwicklung einer generativen KI-Anwendung, die Auswahl der besten Produkte und Tools für Ihren Anwendungsfall und den Zugriff auf die Dokumentation, die Sie für den Einstieg benötigen.

Grundlagen der generativen KI-Entwicklung

Generative KI-Anwendung entwickeln
Informationen zu gängigen Anwendungsfällen und Modelltypen für generative KI
Ermitteln Sie, ob generative KI, herkömmliche KI oder eine Kombination aus beiden zu Ihrem geschäftlichen Anwendungsfall passen könnte.
Hier erfahren Sie, wie Sie die Herausforderungen in jeder Phase der Entwicklung einer Anwendung für generative KI bewältigen.

Infrastruktur für Ihre generative KI-Anwendung auswählen

Hier erfahren Sie, welche Produkte, Frameworks und Tools sich am besten für das Erstellen Ihrer generativen KI-Anwendung eignen. Gängige Komponenten in einer in der Cloud gehosteten generativen KI-Anwendung sind:

  1. Anwendungshosting: Compute zum Hosten Ihrer Anwendung. Ihre Anwendung kann die Clientbibliotheken und SDKs von Google Cloud verwenden, um mit verschiedenen Cloud-Produkten zu kommunizieren.
  2. Modellhosting: Skalierbares und sicheres Hosting für ein generatives Modell.
  3. Modell: Generatives Modell für Text, Chat, Bilder, Code, Einbettungen und multimodal.
  4. Fundierungslösung: Verankern Sie die Modellausgabe auf überprüfbare, aktualisierte Informationsquellen.
  5. Datenbank: Speichern Sie die Daten Ihrer Anwendung. Sie können Ihre vorhandene Datenbank als Fundierungslösung wiederverwenden, indem Sie Prompts über SQL-Abfrage erweitern und/oder Ihre Daten mit einer Erweiterung wie pgvector als Vektoreinbettungen speichern.
  6. Speicher: Speichern Sie Dateien wie Bilder, Videos oder statische Web-Front-Ends. Sie können den Speicher auch für die grundlegenden Fundierungsdaten verwenden (z. B. PDFs), die später in Einbettungen konvertiert und in einer Vektordatenbank gespeichert werden.

Diagramm mit einer allgemeinen Übersicht über eine KI-Anwendungshosting-Infrastruktur, einschließlich eines Modells und seiner Modellhosting-Infrastruktur, Fundierungslösung, Datenbank, Speicher und Anwendungshosting.

In den folgenden Abschnitten werden diese Komponenten beschrieben, damit Sie die richtigen Google Cloud-Produkte auswählen können.

Infrastruktur für das Anwendungshosting

Wählen Sie ein Produkt zum Hosten und Bereitstellen Ihrer Anwendungsarbeitslast aus, wodurch Aufrufe an das generative Modell gesendet werden.
Entscheidungsbaum, der Nutzer durch die Auswahl eines geeigneten Dienstes für das Anwendungshosting führt.

Jetzt starten mit:

Modellhostinginfrastruktur

Google Cloud bietet mehrere Möglichkeiten zum Hosten eines generativen Modells, von der Flagship-Vertex-AI-Plattform bis hin zu anpassbarem und portablem Hosting in Google Kubernetes Engine.

Entscheidungsbaum, der die Nutzer anleitet, das richtige Hosting-Cloud-Modell basierend auf ihren Prioritäten und Anforderungen auszuwählen.

Jetzt starten mit:

Modell

Google Cloud bietet eine Reihe hochmoderner Foundation Models über Vertex AI, einschließlich Gemini. Sie können ein Drittanbietermodell auch in Vertex AI Model Garden oder Self-Hosting in GKE, Cloud Run oder Compute Engine bereitstellen.

Entscheidungsbaum, der die Nutzer zur Auswahl eines Vertex AI-Dienstes führt, um Text oder Code zu generieren, mit Optionen zum Verwenden von Texteinbettungen, Bildern oder Videos.

Jetzt starten mit:

Nullniveau

Damit Sie fundierte und präzise Modellantworten erhalten, können Sie Ihre generative KI-Anwendung mit Echtzeitdaten fundieren. Dies wird als Retrieval Augmented Generation (RAG) bezeichnet.

Sie können die Fundierung mit Ihren eigenen Daten in einer Vektordatenbank implementieren, die ein optimales Format für Vorgänge wie die Ähnlichkeitssuche ist. Google Cloud bietet mehrere Lösungen für Vektordatenbanken für verschiedene Anwendungsfälle.

Hinweis: Sie können auch herkömmliche Datenbanken (keine Vektordatenbanken) nutzen, indem Sie einfach eine vorhandene Datenbank wie Cloud SQL oder Firestore abfragen und das Ergebnis in Ihrer Modell-Eingabeaufforderung verwenden.

Entscheidungsbaum, der den Nutzer durch die Auswahl der richtigen Vektordatenbanklösung für seine Anforderungen führt.

Jetzt starten mit:

Fundierung mit APIs

Statt (oder zusätzlich dazu) Ihre eigenen Daten für die Fundierung zu verwenden, bieten viele Onlinedienste APIs, mit denen Sie Fundierungsdaten abrufen können, um Ihre Modellaufforderung zu erweitern.
Erstellen Sie Erweiterungen, die Large Language Models mit den APIs externer Systeme verbinden, stellen Sie sie bereit und verwalten Sie sie.
Entdecken Sie zahlreiche Dokumentladeprogramme und API-Integrationen für Ihre generativen KI-Anwendungen, von YouTube bis Google Scholar.
Wenn Sie in Vertex AI gehostete Modelle verwenden, können Sie Modellantworten mit Vertex AI Search, der Google Suche oder Inline-/Infile-Text fundieren.

Gleich mit dem Erstellen loslegen

Entwicklungsumgebung einrichten

Installieren Sie die Tools, die Sie zum Erstellen einer generativen KI-Anwendung in Google Cloud benötigen.
Befehlszeilentools zum Einrichten einer lokalen Entwicklungsumgebung und zur Interaktion mit Cloud APIs.
Sehen Sie sich die API-Dokumentation und Beispiele in Ihrer IDE an und beschleunigen Sie die lokale Entwicklung für GKE und Cloud Run.
Erfahren Sie, wie Sie sich aus Ihrer lokalen Umgebung und von gehosteten Arbeitslasten aus bei Google Cloud APIs authentifizieren.
LangChain ist ein Open-Source-Framework für generative KI-Anwendungen, mit dem Sie Kontext in Ihre Prompts integrieren und basierend auf der Antwort des Modells Maßnahmen ergreifen können.

Prompts entwerfen und Modelle bewerten

Lernen Sie Strategien für Prompts kennen und experimentieren Sie mit verschiedenen Modellen.
Lernen Sie Strategien zum Entwerfen von Prompts für verschiedene Arten von Datentypen kennen, von Text und Code bis hin zu multimodal.
Erfahren Sie, wie Sie Prompts in Vertex AI Studio entwerfen, testen und verwalten.
Sehen Sie sich Dutzende von Beispielen für Anwendungsfälle an, z. B. Klassifizierung, Ideenfindung und Zusammenfassung.
Entdecken Sie Aufforderungsbeispiele zum Generieren, Entwickeln und Kommunizieren neuer Ideen.

Codebeispiele

Erstellen Sie einen Fork auf GitHub und beginnen Sie mit dem Erstellen.

Hier erfahren Sie, wie Sie mit dem Vertex AI Agent Builder und Firebase einen webbasierten Chatbot für die Beantwortung von Fragen erstellen.

Einsteiger Node.js

Hier erfahren Sie, wie Sie eine einfache Python Flask-Anwendung erstellen, die ein vortrainiertes Grundlagenmodell in Vertex AI aufruft.

Einsteiger Python

Erstellen Sie mit Gemini in Vertex AI, Cloud Run und Streamlit eine Webanwendung, um Ideen für Marketingkampagnen zu generieren.

Einsteiger Python

Erfahren Sie, wie Sie Vertex AI Search und LangChain verwenden, um Modell-Prompts auf einer überprüfbaren Wissensquelle zu fundieren (Google Cloud-Whitepaper).

Mittelstufe Python

Erfahren Sie, wie Sie Funktionsaufrufe implementieren, d. h. die Verwendung eines LLM zum Ausfüllen eines Anfragetexts, den Sie dann an eine externe API senden können.

Mittelstufe Python

Beispielanwendung für die Abrufbare Generierung mit AlloyDB for PostgreSQL und Vertex AI. (Blogpost, Codelab).

Mittelstufe Python

Architekturanleitung und Schnellstartlösungen

Empfehlungen und Beispiele für generative KI-Anwendungen, die sicher, effizient, stabil, leistungsstark und kostengünstig sind.

Verwenden Sie diese Referenzarchitektur, um die Infrastruktur für die Ausführung einer generativen KI-Anwendung mit Retrieval Augmented Generation (RAG) mithilfe von Vertex AI und AlloyDB for PostgreSQL zu entwerfen.

Mittelstufe

Verwenden Sie dieses Referenzarchitektur-Design, um eine generative KI-Anwendung mit Retrieval Augmented Generation (RAG) unter Verwendung von GKE, Cloud SQL und Open-Source-Tools wie Ray, Hugging Face und LangChain auszuführen.

Mittelstufe

In diesem Dokument finden Sie Designanleitungen zur Verwendung und Integration der verschiedenen Speicheroptionen von Google Cloud für wichtige KI- und ML-Arbeitslasten.

Erweitert

Stellen Sie eine Beispielanwendung mit einem Klick bereit, um lange Dokumente mit Vertex AI zusammenzufassen.

Mittelstufe

Stellen Sie eine Beispielanwendung mit einem Klick bereit, die in Cloud SQL gespeicherte Vektoreinbettungen verwendet, um die Genauigkeit von Antworten aus einer Chatanwendung zu verbessern.

Mittelstufe

Stellen Sie eine Beispielanwendung mit einem Klick bereit, die Frage-und-Antwort-Paare aus einer Reihe von Dokumenten extrahiert, zusammen mit einer Pipeline, die die Anwendung beim Hochladen eines Dokuments auslöst.

Mittelstufe