Infrastruktur für Ihre generative KI-Anwendung auswählen
Hier erfahren Sie, welche Produkte, Frameworks und Tools sich am besten für das Erstellen Ihrer generativen KI-Anwendung eignen. Gängige Komponenten in einer in der Cloud gehosteten generativen KI-Anwendung sind:
- Anwendungshosting: Compute zum Hosten Ihrer Anwendung. Ihre Anwendung kann die Clientbibliotheken und SDKs von Google Cloud verwenden, um mit verschiedenen Cloud-Produkten zu kommunizieren.
- Modellhosting: Skalierbares und sicheres Hosting für ein generatives Modell.
- Modell: Generatives Modell für Text, Chat, Bilder, Code, Einbettungen und multimodal.
- Fundierungslösung: Verankern Sie die Modellausgabe auf überprüfbare, aktualisierte Informationsquellen.
- Datenbank: Speichern Sie die Daten Ihrer Anwendung. Sie können Ihre vorhandene Datenbank als Fundierungslösung wiederverwenden, indem Sie Prompts über SQL-Abfrage erweitern oder Ihre Daten mit einer Erweiterung wie pgvector als Vektoreinbettungen speichern.
- Speicher: Speichern Sie Dateien wie Bilder, Videos oder statische Web-Front-Ends. Sie können den Speicher auch für die grundlegenden Fundierungsdaten verwenden (z. B. PDFs), die später in Einbettungen konvertiert und in einer Vektordatenbank gespeichert werden.
In den folgenden Abschnitten werden diese Komponenten beschrieben, damit Sie die richtigen Google Cloud-Produkte auswählen können.
Infrastruktur für das Anwendungshosting
Wählen Sie ein Produkt zum Hosten und Bereitstellen Ihrer Anwendungsarbeitslast aus, wodurch Aufrufe an das generative Modell gesendet werden.
Jetzt starten mit:
Modellhostinginfrastruktur
Google Cloud bietet mehrere Möglichkeiten zum Hosten eines generativen Modells, von der Flagship-Vertex-AI-Plattform bis hin zu anpassbarem und portablem Hosting in Google Kubernetes Engine.
Jetzt starten mit:
Modell
Google Cloud bietet eine Reihe hochmoderner Foundation Models über Vertex AI, einschließlich Gemini. Sie können ein Drittanbietermodell auch in Vertex AI Model Garden oder Self-Hosting in GKE, Cloud Run oder Compute Engine bereitstellen.
Jetzt starten mit:
- Gemini
- Codey
- Imagen
- text-embedding
- Vertex AI Model Garden (Open-Source-Modelle)
- Hugging Face Model Hub (Open-Source-Modelle)
Nullniveau
Damit Sie fundierte und präzise Modellantworten erhalten, können Sie Ihre generative KI-Anwendung mit Echtzeitdaten fundieren. Dies wird als Retrieval Augmented Generation (RAG) bezeichnet.
Sie können die Fundierung mit Ihren eigenen Daten in einer Vektordatenbank implementieren, die ein optimales Format für Vorgänge wie die Ähnlichkeitssuche ist. Google Cloud bietet mehrere Lösungen für Vektordatenbanken für verschiedene Anwendungsfälle.
Hinweis: Sie können auch herkömmliche Datenbanken (keine Vektordatenbanken) nutzen, indem Sie eine vorhandene Datenbank wie Cloud SQL oder Firestore abfragen und das Ergebnis in Ihrer Modell-Eingabeaufforderung verwenden.
Jetzt starten mit:
- Vertex AI Agent Builder (früher Enterprise Search, Gen AI App Builder, Discovery Engine)
- Vektorsuche (früher Matching Engine)
- AlloyDB for PostgreSQL
- Cloud SQL
- BigQuery
Fundierung mit APIs
Statt (oder zusätzlich dazu) Ihre eigenen Daten für die Fundierung zu verwenden, bieten viele Onlinedienste APIs, mit denen Sie Fundierungsdaten abrufen können, um Ihre Modellaufforderung zu erweitern.
Vertex AI-Erweiterungen (private Vorschau)
Erstellen Sie Erweiterungen, die Large Language Models mit den APIs externer Systeme verbinden, stellen Sie sie bereit und verwalten Sie sie.
Langchain-Komponenten
Entdecken Sie zahlreiche Dokumentladeprogramme und API-Integrationen für Ihre generativen KI-Anwendungen, von YouTube bis Google Scholar.
Fundierung in Vertex AI
Wenn Sie in Vertex AI gehostete Modelle verwenden, können Sie Modellantworten mit Vertex AI Search, der Google Suche oder Inline-/Infile-Text fundieren.
Gleich mit dem Erstellen loslegen
Entwicklungsumgebung für Google Cloud einrichten
LangChain einrichten
LangChain ist ein Open-Source-Framework für generative KI-Anwendungen, mit dem Sie Kontext in Ihre Prompts einbinden und basierend auf der Antwort des Modells Maßnahmen ergreifen können.
Codebeispiele ansehen und Beispielanwendungen bereitstellen
Sehen Sie sich Codebeispiele für gängige Anwendungsfälle und Beispiele für generative KI-Anwendungen an, die sicher, effizient, stabil, leistungsstark und kostengünstig sind.