Generative KI-Anwendung in Google Cloud erstellen

Google Cloud bietet eine Reihe von Produkten und Tools zum Erstellen generativer KI-Anwendungen mit Skalierung, Sicherheit und Beobachtbarkeit auf Unternehmensniveau.

Auf dieser Seite erfahren Sie mehr über die Phasen der Entwicklung einer generativen KI-Anwendung, die Auswahl der besten Produkte und Tools für Ihren Anwendungsfall und den Zugriff auf die Dokumentation, die Sie für den Einstieg benötigen.

Grundlagen der generativen KI-Entwicklung

Generative KI-Anwendung entwickeln

Informationen zu gängigen Anwendungsfällen und Modelltypen für generative KI

Wann werden generative oder herkömmliche KI verwendet?

Ermitteln Sie, ob generative KI, herkömmliche KI oder eine Kombination aus beiden zu Ihrem geschäftlichen Anwendungsfall passen könnte.

Generative AI-Anwendung entwickeln

Hier erfahren Sie, wie Sie die Herausforderungen in jeder Phase der Entwicklung einer Anwendung für generative KI bewältigen.

Infrastruktur für Ihre generative KI-Anwendung auswählen

Hier erfahren Sie, welche Produkte, Frameworks und Tools sich am besten für das Erstellen Ihrer generativen KI-Anwendung eignen. Gängige Komponenten in einer in der Cloud gehosteten generativen KI-Anwendung sind:

Anwendungshosting: Compute zum Hosten Ihrer Anwendung. Ihre Anwendung kann die Clientbibliotheken und SDKs von Google Cloud verwenden, um mit verschiedenen Cloud-Produkten zu kommunizieren.
Modellhosting: Skalierbares und sicheres Hosting für ein generatives Modell.
Modell: Generatives Modell für Text, Chat, Bilder, Code, Einbettungen und multimodal.
Fundierungslösung: Verankern Sie die Modellausgabe auf überprüfbare, aktualisierte Informationsquellen.
Datenbank: Speichern Sie die Daten Ihrer Anwendung. Sie können Ihre vorhandene Datenbank als Fundierungslösung wiederverwenden, indem Sie Prompts über SQL-Abfrage erweitern und/oder Ihre Daten mit einer Erweiterung wie pgvector als Vektoreinbettungen speichern.
Speicher: Speichern Sie Dateien wie Bilder, Videos oder statische Web-Front-Ends. Sie können den Speicher auch für die grundlegenden Fundierungsdaten verwenden (z. B. PDFs), die später in Einbettungen konvertiert und in einer Vektordatenbank gespeichert werden.

Diagramm mit einer allgemeinen Übersicht über eine KI-Anwendungshosting-Infrastruktur, einschließlich eines Modells und seiner Modellhosting-Infrastruktur, Fundierungslösung, Datenbank, Speicher und Anwendungshosting.

In den folgenden Abschnitten werden diese Komponenten beschrieben, damit Sie die richtigen Google Cloud-Produkte auswählen können.

Infrastruktur für das Anwendungshosting

Wählen Sie ein Produkt zum Hosten und Bereitstellen Ihrer Anwendungsarbeitslast aus, wodurch Aufrufe an das generative Modell gesendet werden.

Jetzt starten mit:

Modellhostinginfrastruktur

Google Cloud bietet mehrere Möglichkeiten zum Hosten eines generativen Modells, von der Flagship-Vertex-AI-Plattform bis hin zu anpassbarem und portablem Hosting in Google Kubernetes Engine.

Entscheidungsbaum, der die Nutzer anleitet, das richtige Hosting-Cloud-Modell basierend auf ihren Prioritäten und Anforderungen auszuwählen.

Jetzt starten mit:

Modell

Google Cloud bietet eine Reihe hochmoderner Foundation Models über Vertex AI, einschließlich Gemini. Sie können ein Drittanbietermodell auch in Vertex AI Model Garden oder Self-Hosting in GKE, Cloud Run oder Compute Engine bereitstellen.

Entscheidungsbaum, der die Nutzer zur Auswahl eines Vertex AI-Dienstes führt, um Text oder Code zu generieren, mit Optionen zum Verwenden von Texteinbettungen, Bildern oder Videos.

Jetzt starten mit:

Gemini
Codey
Imagen
Texteinbettung
Vertex AI Model Garden (Open-Source-Modelle)
HuggingFace Model Hub (Open-Source-Modelle)

Nullniveau

Damit Sie fundierte und präzise Modellantworten erhalten, können Sie Ihre generative KI-Anwendung mit Echtzeitdaten fundieren. Dies wird als Retrieval Augmented Generation (RAG) bezeichnet.

Sie können die Fundierung mit Ihren eigenen Daten in einer Vektordatenbank implementieren, die ein optimales Format für Vorgänge wie die Ähnlichkeitssuche ist. Google Cloud bietet mehrere Lösungen für Vektordatenbanken für verschiedene Anwendungsfälle.

Hinweis: Sie können auch herkömmliche Datenbanken (keine Vektordatenbanken) nutzen, indem Sie einfach eine vorhandene Datenbank wie Cloud SQL oder Firestore abfragen und das Ergebnis in Ihrer Modell-Eingabeaufforderung verwenden.

Entscheidungsbaum, der den Nutzer durch die Auswahl der richtigen Vektordatenbanklösung für seine Anforderungen führt.

Jetzt starten mit:

Vertex AI Agent Builder (früher Enterprise Search, Gen AI App Builder, Discovery Engine)
Vektorsuche (früher Matching Engine)
AlloyDB for PostgreSQL
Cloud SQL
BigQuery

Fundierung mit APIs

Statt (oder zusätzlich dazu) Ihre eigenen Daten für die Fundierung zu verwenden, bieten viele Onlinedienste APIs, mit denen Sie Fundierungsdaten abrufen können, um Ihre Modellaufforderung zu erweitern.

Vertex AI-Erweiterungen (private Vorschau)

Erstellen Sie Erweiterungen, die Large Language Models mit den APIs externer Systeme verbinden, stellen Sie sie bereit und verwalten Sie sie.

Langchain-Komponenten

Entdecken Sie zahlreiche Dokumentladeprogramme und API-Integrationen für Ihre generativen KI-Anwendungen, von YouTube bis Google Scholar.

Fundierung in Vertex AI

Wenn Sie in Vertex AI gehostete Modelle verwenden, können Sie Modellantworten mit Vertex AI Search, der Google Suche oder Inline-/Infile-Text fundieren.

Gleich mit dem Erstellen loslegen

Entwicklungsumgebung einrichten

Installieren Sie die Tools, die Sie zum Erstellen einer generativen KI-Anwendung in Google Cloud benötigen.

Google Cloud CLI installieren

Befehlszeilentools zum Einrichten einer lokalen Entwicklungsumgebung und zur Interaktion mit Cloud APIs.

Cloud Code-Erweiterung in Ihrer IDE installieren

Sehen Sie sich die API-Dokumentation und Beispiele in Ihrer IDE an und beschleunigen Sie die lokale Entwicklung für GKE und Cloud Run.

Authentifizierung einrichten

Erfahren Sie, wie Sie sich aus Ihrer lokalen Umgebung und von gehosteten Arbeitslasten aus bei Google Cloud APIs authentifizieren.

LangChain einrichten

LangChain ist ein Open-Source-Framework für generative KI-Anwendungen, mit dem Sie Kontext in Ihre Prompts integrieren und basierend auf der Antwort des Modells Maßnahmen ergreifen können.

Prompts entwerfen und Modelle bewerten

Lernen Sie Strategien für Prompts kennen und experimentieren Sie mit verschiedenen Modellen.

Einführung in das Prompt-Design

Lernen Sie Strategien zum Entwerfen von Prompts für verschiedene Arten von Datentypen kennen, von Text und Code bis hin zu multimodal.

Vertex AI Studio

Erfahren Sie, wie Sie Prompts in Vertex AI Studio entwerfen, testen und verwalten.

Prompt-Beispiele generativer KI

Sehen Sie sich Dutzende von Beispielen für Anwendungsfälle an, z. B. Klassifizierung, Ideenfindung und Zusammenfassung.

Ideenfindung mit generativen Modellen in Vertex AI

Entdecken Sie Aufforderungsbeispiele zum Generieren, Entwickeln und Kommunizieren neuer Ideen.

Modellbewertung in Vertex AI

Verwenden Sie Vertex AI, um messwertbasierte Bewertungen oder direkte Bewertungen durchzuführen.

Codebeispiele

Erstellen Sie einen Fork auf GitHub und beginnen Sie mit dem Erstellen.

Webchatbot: Fragen zum Google Store beantworten

Hier erfahren Sie, wie Sie mit dem Vertex AI Agent Builder und Firebase einen webbasierten Chatbot für die Beantwortung von Fragen erstellen.

Chat-App mit Eventarc und Vertex AI

Hier erfahren Sie, wie Sie eine einfache Python Flask-Anwendung erstellen, die ein vortrainiertes Grundlagenmodell in Vertex AI aufruft.

Marketingkampagne mit Gemini erstellen

Erstellen Sie mit Gemini in Vertex AI, Cloud Run und Streamlit eine Webanwendung, um Ideen für Marketingkampagnen zu generieren.

Question Answering-App mit „The Practitioner's Guide to MLOps“

Erfahren Sie, wie Sie Vertex AI Search und LangChain verwenden, um Modell-Prompts auf einer überprüfbaren Wissensquelle zu fundieren (Google Cloud-Whitepaper).

Weather API Request Helper: Funktionsaufruf mit Gemini

Erfahren Sie, wie Sie Funktionsaufrufe implementieren, d. h. die Verwendung eines LLM zum Ausfüllen eines Anfragetexts, den Sie dann an eine externe API senden können.

Airport Assistant: Abruf generativer KI-Datenbanken

Beispielanwendung für die Abrufbare Generierung mit AlloyDB for PostgreSQL und Vertex AI. (Blogpost, Codelab).

Architekturanleitung und Schnellstartlösungen

Empfehlungen und Beispiele für generative KI-Anwendungen, die sicher, effizient, stabil, leistungsstark und kostengünstig sind.