Dieser Leitfaden für Einsteiger bietet eine Einführung in die Kerntechnologien der generativen KI und erläutert, wie sie zusammen für Chatbots und Anwendungen genutzt werden. Generative KI (auch genAI oder genAI genannt) ist ein Bereich des maschinellen Lernens (ML), der ML-Modelle zum Generieren neuer Inhalte entwickelt und verwendet.
Generative KI-Modelle werden aufgrund ihrer Größe und dem Umstand, dass sie natürliche Sprache verstehen und generieren können, oft als Large Language Models (LLM) bezeichnet. Abhängig von den Daten, mit denen die Modelle trainiert werden, können diese Modelle Inhalte aus verschiedenen Modalitäten verstehen und generieren, darunter Text, Bilder, Videos und Audio. Modelle, die mit mehreren Datenmodalitäten arbeiten, werden als multimodale Modelle bezeichnet.
Erstellung von Inhalten
Damit generative KI-Modelle Inhalte generieren können, die in realen Anwendungen nützlich sind, benötigen diese die folgenden Funktionen:
So führen Sie neue Aufgaben aus:
Generative KI-Modelle wurden für allgemeine Aufgaben entwickelt. Wenn ein Modell Aufgaben ausführen soll, die für Ihren Anwendungsfall spezifisch sind, müssen Sie in der Lage sein, das Modell anzupassen. In Vertex AI können Sie Ihr Modell durch die Modellabstimmung anpassen.
Auf externe Informationen zugreifen:
Generative AI-Modelle werden mit riesigen Datenmengen trainiert. Damit diese Modelle nützlich sind, müssen sie auf Informationen außerhalb ihrer Trainingsdaten zugreifen können. Wenn Sie beispielsweise einen Kundenservice-Chatbot erstellen möchten, der von einem generativen KI-Modell unterstützt wird, benötigt das Modell Zugriff auf Informationen zu den von Ihnen angebotenen Produkten und Diensten. In Vertex AI verwenden Sie die Funktionen für Fundierungs- und Funktionsaufrufe, um dem Modell den Zugriff auf externe Informationen zu erleichtern.
Schädliche Inhalte blockieren:
Generative KI-Modelle können Ausgaben generieren, die Sie nicht erwarten, einschließlich Text, der anstößig oder insensitiv ist. Zur Gewährleistung der Sicherheit und zur Verhinderung von Missbrauch benötigen die Modelle Sicherheitsfilter, um Prompts und Antworten zu blockieren, die als potenziell schädlich eingestuft werden. Vertex AI hat integrierte Sicherheitsfeatures, die die verantwortungsvolle Nutzung unserer generativen KI-Dienste fördern.
Das folgende Diagramm zeigt, wie diese verschiedenen Funktionen zusammenwirken, um die gewünschten Inhalte zu generieren:
Prompt
Der Generative AI-Workflow beginnt in der Regel mit Prompts. Ein Prompt ist eine Anfrage in natürlicher Sprache, die an ein generatives KI-Modell gesendet wird, um eine Antwort auszulösen. Je nach Modell kann ein Prompt Text, Bilder, Videos, Audio, Dokumente und andere oder sogar mehrere Modalitäten (multimodal) enthalten. Das Erstellen eines Prompts zum Abrufen der gewünschten Antwort vom Modell ist eine Methode, die als Prompt-Design bezeichnet wird. Das Prompt-Design ist zwar ein Versuch-und-Irrtums-Prozess, aber es gibt Prompt-Design-Prinzipien und -Strategien, mit denen Sie das Modell dazu bewegen können, sich wie gewünscht zu verhalten. Vertex AI Studio bietet ein Tool zur Prompt-Verwaltung, mit dem Sie Ihre Prompts verwalten können. |
Basismodelle
Aufforderungen werden zur Generierung von Antworten an ein Generative-AI-Modell gesendet. Vertex AI bietet eine Vielzahl von generativen KI-Foundation Models, auf die über eine verwaltete API zugegriffen werden kann. Dazu gehören:
Die Modelle unterscheiden sich in Größe, Modalität und Kosten. Sie können Google-Modelle sowie offene Modelle und Modelle von Google-Partnern in Model Garden erkunden. |
Modellanpassung
Sie können das Standardverhalten der Grundlagenmodelle von Google so anpassen, dass sie die gewünschten Ergebnisse konsistent mit komplexen Prompts generieren. Dieser Anpassungsprozess wird als Modellabstimmung bezeichnet. Durch die Modelloptimierung können Sie die Kosten und Latenz Ihrer Anfragen reduzieren, indem Sie die Prompts vereinfachen. Vertex AI bietet auch Tools zur Modellbewertung, mit denen Sie die Leistung Ihres feinabgestimmten Modells bewerten können. Sobald Ihr abgestimmtes Modell produktionsbereit ist, können Sie es auf einem Endpunkt bereitstellen und die Leistung wie in standardmäßigen MLOps-Workflows überwachen. |
Auf externe Informationen zugreifen
Vertex AI bietet mehrere Möglichkeiten, dem Modell Zugriff auf externe APIs und Echtzeitinformationen zu gewähren.
|
Zitationsprüfung
Nachdem die Antwort generiert wurde, prüft Vertex AI, ob Zitationen in die Antwort aufgenommen werden müssen. Wenn ein beträchtlicher Teil des Antworttextes aus einer bestimmten Quelle stammt, wird diese Quelle den Zitationsmetadaten in der Antwort hinzugefügt. |
Verantwortungsbewusste KI und Sicherheit
Die letzte Prüfungsebene, die den Prompt und die Antwort durchlaufen, bevor sie zurückgegeben werden, sind die Sicherheitsfilter. Vertex AI prüft sowohl die Prompts als auch die Antwort darauf, wie stark der Prompt oder Antwort zu einer Sicherheitskategorie gehört. Wenn der Schwellenwert für eine oder mehrere Kategorien überschritten wird, wird die Antwort blockiert und Vertex AI gibt eine Fallback-Antwort zurück. |
Antwort
Wenn der Prompt und die Antwort die Sicherheitsfilterprüfungen bestehen, wird die Antwort zurückgegeben. Normalerweise wird die Antwort alle auf einmal zurückgegeben. Mit Vertex AI können Sie Antworten jedoch auch schrittweise empfangen, während sie generiert werden. Dazu muss das Streaming aktiviert sein. |
Vertex AI Studio-Konsolenumgebungen
Wenn Sie Vertex AI Studio mit der kostenlosen Testversion oder ohne Anmeldung in Google Cloud verwenden, sind einige Features nicht verfügbar. Wenn Sie Vertex AI Studio testen möchten, akzeptieren Sie in der Google Cloud Console das Fenster mit den Nutzungsbedingungen für Vertex AI Studio.
Ohne Google Cloud-Konto verwenden | Mit einem kostenlosen Google Cloud-Testkonto nutzen | Mit einem vorhandenen Google Cloud-Konto nutzen | |
---|---|---|---|
Anmeldung erforderlich | Nein | Ja | Ja |
Abfragen pro Minute | 2 QPM für alle multimodalen Modelle | Siehe Kontingentlimits | Siehe Kontingentlimits |
Angebotenes Guthaben | 0 $ | Bis zu 300 $ für 90 Tage | 0 $ |
Prompt-Galerie | Nein | Ja | Ja |
Prompt-Designer | Ja | Ja | Ja |
Prompts speichern | Nein | Ja | Ja |
Prompt-Verlauf | Nein | Ja | Ja |
Erweiterte Parameter | Nein | Nein | Ja |
Abstimmung | Nein | Nein | Ja |
API-Nutzung | Nein | Ja | Ja |
Abrechnung erforderlich | Nein | Nein | Ja |
Einstieg | Zu Vertex AI Studio | Für kostenlosen Testzeitraum registrieren | Vertex AI in Ihrer Konsole testen |
Erste Schritte mit generativer KI in Vertex AI
- Wagen Sie sich an eine Kurzeinführung mit Generative AI Studio oder der Vertex AI API.
- Vortrainierte Modelle in Model Garden untersuchen.
- Sehen Sie sich die Referenz zum Vertex AI Gemini API SDK für Python, Node.js ,Java ,Go oder C#an.
- Verantwortungsbewusste Best Practices für KI und Sicherheitsfilter von Vertex AI
- Informationen zu Preisen.
- Gemini mithilfe der OpenAI-Bibliothek aufrufen