Infrastruktur für Ihre generative KI-Anwendung auswählen

Hier erfahren Sie, welche Produkte, Frameworks und Tools sich am besten für das Erstellen Ihrer generativen KI-Anwendung eignen. Gängige Komponenten in einer in der Cloud gehosteten generativen KI-Anwendung sind:

  1. Anwendungshosting: Compute zum Hosten Ihrer Anwendung. Ihre Anwendung kann die Clientbibliotheken und SDKs von Google Cloud verwenden, um mit verschiedenen Cloud-Produkten zu kommunizieren.
  2. Modellhosting: Skalierbares und sicheres Hosting für ein generatives Modell.
  3. Modell: Generatives Modell für Text, Chat, Bilder, Code, Einbettungen und multimodal.
  4. Fundierungslösung: Verankern Sie die Modellausgabe auf überprüfbare, aktualisierte Informationsquellen.
  5. Datenbank: Speichern Sie die Daten Ihrer Anwendung. Sie können Ihre vorhandene Datenbank als Fundierungslösung wiederverwenden, indem Sie Prompts über SQL-Abfrage erweitern oder Ihre Daten mit einer Erweiterung wie pgvector als Vektoreinbettungen speichern.
  6. Speicher: Speichern Sie Dateien wie Bilder, Videos oder statische Web-Front-Ends. Sie können den Speicher auch für die grundlegenden Fundierungsdaten verwenden (z. B. PDFs), die später in Einbettungen konvertiert und in einer Vektordatenbank gespeichert werden.

Diagramm mit einer allgemeinen Übersicht über eine KI-Anwendungshosting-Infrastruktur, einschließlich eines Modells und seiner Modellhosting-Infrastruktur, Fundierungslösung, Datenbank, Speicher und Anwendungshosting.

In den folgenden Abschnitten werden diese Komponenten beschrieben, damit Sie die richtigen Google Cloud-Produkte auswählen können.

Infrastruktur für das Anwendungshosting

Wählen Sie ein Produkt zum Hosten und Bereitstellen Ihrer Anwendungsarbeitslast aus, wodurch Aufrufe an das generative Modell gesendet werden.

Entscheidungsbaum, der Nutzer durch die Auswahl eines geeigneten Dienstes für das Anwendungshosting führt.

Jetzt starten mit:

Modellhostinginfrastruktur

Google Cloud bietet mehrere Möglichkeiten zum Hosten eines generativen Modells, von der Flagship-Vertex-AI-Plattform bis hin zu anpassbarem und portablem Hosting in Google Kubernetes Engine.

Entscheidungsbaum, der die Nutzer anleitet, das richtige Hosting-Cloud-Modell basierend auf ihren Prioritäten und Anforderungen auszuwählen.

Jetzt starten mit:

Modell

Google Cloud bietet eine Reihe hochmoderner Foundation Models über Vertex AI, einschließlich Gemini. Sie können ein Drittanbietermodell auch in Vertex AI Model Garden oder Self-Hosting in GKE, Cloud Run oder Compute Engine bereitstellen.

Entscheidungsbaum, der die Nutzer zur Auswahl eines Vertex AI-Dienstes führt, um Text oder Code zu generieren, mit Optionen zum Verwenden von Texteinbettungen, Bildern oder Videos.

Jetzt starten mit:

Nullniveau

Damit Sie fundierte und präzise Modellantworten erhalten, können Sie Ihre generative KI-Anwendung mit Echtzeitdaten fundieren. Dies wird als Retrieval Augmented Generation (RAG) bezeichnet.

Sie können die Fundierung mit Ihren eigenen Daten in einer Vektordatenbank implementieren, die ein optimales Format für Vorgänge wie die Ähnlichkeitssuche ist. Google Cloud bietet mehrere Lösungen für Vektordatenbanken für verschiedene Anwendungsfälle.

Hinweis: Sie können auch herkömmliche Datenbanken (keine Vektordatenbanken) nutzen, indem Sie eine vorhandene Datenbank wie Cloud SQL oder Firestore abfragen und das Ergebnis in Ihrer Modell-Eingabeaufforderung verwenden.

Entscheidungsbaum, der den Nutzer durch die Auswahl der richtigen Vektordatenbanklösung für seine Anforderungen führt.

Jetzt starten mit:

Fundierung mit APIs

Statt (oder zusätzlich dazu) Ihre eigenen Daten für die Fundierung zu verwenden, bieten viele Onlinedienste APIs, mit denen Sie Fundierungsdaten abrufen können, um Ihre Modellaufforderung zu erweitern.

Vertex AI-Erweiterungen (private Vorschau)

Erstellen Sie Erweiterungen, die Large Language Models mit den APIs externer Systeme verbinden, stellen Sie sie bereit und verwalten Sie sie.

Langchain-Komponenten

Entdecken Sie zahlreiche Dokumentladeprogramme und API-Integrationen für Ihre generativen KI-Anwendungen, von YouTube bis Google Scholar.

Fundierung in Vertex AI

Wenn Sie in Vertex AI gehostete Modelle verwenden, können Sie Modellantworten mit Vertex AI Search, der Google Suche oder Inline-/Infile-Text fundieren.

Gleich mit dem Erstellen loslegen

Entwicklungsumgebung für Google Cloud einrichten

LangChain einrichten

LangChain ist ein Open-Source-Framework für generative KI-Anwendungen, mit dem Sie Kontext in Ihre Prompts einbinden und basierend auf der Antwort des Modells Maßnahmen ergreifen können.

Codebeispiele ansehen und Beispielanwendungen bereitstellen

Sehen Sie sich Codebeispiele für gängige Anwendungsfälle und Beispiele für generative KI-Anwendungen an, die sicher, effizient, stabil, leistungsstark und kostengünstig sind.