Diese Seite wurde von der Cloud Translation API übersetzt.

Offene Gemma-Modelle verwenden

Gemma ist eine Reihe einfacher, offener generativer KI-Modelle (künstliche Intelligenz). Gemma-Modelle können in Ihren Anwendungen und auf Ihrer Hardware, Mobilgeräten oder gehosteten Diensten ausgeführt werden. Sie können diese Modelle auch mithilfe von Abstimmungstechniken anpassen, damit sie hervorragende Aufgaben ausführen, die für Sie und Ihre Nutzer relevant sind. Gemma-Modelle basieren auf Gemini-Modellen und sind für die Erweiterung der KI-Entwicklungscommunity vorgesehen.

Durch das Fine-Tuning lässt sich die Leistung eines Modells bei bestimmten Aufgaben verbessern. Da Modelle der Gemma-Modellfamilie offene Gewichte haben, können Sie sie mit dem KI-Framework Ihrer Wahl und dem Vertex AI SDK optimieren. Sie können ein Notebook-Beispiel öffnen, um das Gemma-Modell mithilfe eines Links auf der Gemma-Modellkarte in Model Garden abzustimmen.

Die folgenden Gemma-Modelle können mit Vertex AI verwendet werden. Weitere Informationen zu den Gemma-Modellen finden Sie auf den entsprechenden Model Garden-Modellkarten.

Modellname	Anwendungsfälle	Model Garden-Modellkarte
Gemma 3n	Kann multimodale Eingaben verarbeiten, d. h. Text-, Bild-, Video- und Audioeingaben, und Textausgaben generieren.	Zur Gemma 3n-Modellkarte
Gemma 3	Am besten geeignet für Aufgaben zur Textgenerierung und zum Bildverständnis, einschließlich Fragen und Antworten, Zusammenfassung und Schlussfolgerung.	Zur Gemma 3-Modellkarte
Gemma 2	Optimal für die Textgenerierung, -zusammenfassung und -extraktion.	Zur Gemma 2-Modellkarte
Gemma	Optimal für die Textgenerierung, -zusammenfassung und -extraktion.	Zur Gemma-Modellkarte
CodeGemma	Optimal für die Codegenerierung und -vervollständigung.	Zur CodeGemma-Modellkarte
PaliGemma 2	Am besten geeignet für Aufgaben zum Erstellen von Bildunterschriften und zum Beantworten visueller Fragen.	Zur PaliGemma 2-Modellkarte
PaliGemma	Am besten geeignet für Aufgaben zum Erstellen von Bildunterschriften und zum Beantworten visueller Fragen.	Zur PaliGemma-Modellkarte
ShieldGemma 2	Prüft die Sicherheit von synthetischen und natürlichen Bildern, damit Sie robuste Datasets und Modelle erstellen können.	Zur ShieldGemma 2-Modellkarte
TxGemma	Am besten geeignet für Aufgaben zur therapeutischen Vorhersage, einschließlich Klassifizierung, Regression oder Generierung, und für Reasoning-Aufgaben.	Zur TxGemma-Modellkarte
MedGemma	Gemma 3-Varianten, die für die Leistung beim Verarbeiten von medizinischem Text und medizinischen Bildern trainiert wurden.	Zur MedGemma-Modellkarte
MedSigLIP	SigLIP-Variante, die darauf trainiert ist, medizinische Bilder und Text in einen gemeinsamen Einbettungsbereich zu codieren.	Zur MedSigLIP-Modellkarte
T5Gemma	Gut geeignet für eine Vielzahl von generativen Aufgaben, einschließlich Fragenbeantwortung, Zusammenfassung und logisches Denken.	Zur T5Gemma-Modellkarte

Im Folgenden finden Sie einige Optionen, wo Sie Gemma verwenden können:

Gemma mit Vertex AI verwenden

Vertex AI bietet eine verwaltete Plattform zum schnellen Erstellen und Skalieren von ML-Projekten, ohne dass interne MLOps-Kenntnisse erforderlich sind. Sie können Vertex AI als nachgelagerte Anwendung verwenden, die die Gemini-Modelle bereitstellt. Sie können beispielsweise Gewichtungen aus der Keras-Implementierung von Gemma portieren. Als Nächstes können Sie Vertex AI verwenden, um diese Version von Gemma für Vorhersagen bereitzustellen. Wir empfehlen die Verwendung von Vertex AI, wenn Sie End-to-End-MLOps-Funktionen, Mehrwert-ML-Features und eine serverlose Umgebung für eine optimierte Entwicklung wünschen.

Informationen zu den ersten Schritten mit Gemma finden Sie in den folgenden Notebooks:

Gemma in anderen Google Cloud Produkten verwenden

Sie können Gemma mit anderen Google Cloud Produkten wie Google Kubernetes Engine und Dataflow verwenden.

Gemma mit GKE verwenden

Google Kubernetes Engine (GKE) ist die Google Cloud Lösung für verwaltete Kubernetes, die Skalierbarkeit, Sicherheit, Robustheit und Kosteneffizienz bietet. Wir empfehlen diese Option, wenn Sie bereits Kubernetes-Investitionen haben, Ihre Organisation über interne MLOps-Kenntnisse verfügt oder wenn Sie eine detaillierte Kontrolle über komplexe KI/ML-Arbeitslasten mit besonderer Sicherheit, Datenpipeline und Ressourcen benötigen Managementanforderungen. Weitere Informationen finden Sie in den folgenden Anleitungen der GKE-Dokumentation:

Gemma mit Dataflow verwenden

Sie können Gemma-Modelle mit Dataflow für die Sentimentanalyse verwenden. Mit Dataflow Inferenz-Pipelines ausführen, die die Gemini-Modelle verwenden. Weitere Informationen finden Sie unter Inferenzpipelines mit offenen Gemma-Modellen ausführen.

Gemma mit Colab verwenden

Sie können Gemma mit Colaboratory verwenden, um Ihre Gemma-Lösung zu erstellen. In Colab können Sie Gemma mit Framework-Optionen wie PyTorch und JAX verwenden. Weitere Informationen erhalten Sie unter:

Gemma-Modellgrößen und -funktionen

Gemma-Modelle sind in verschiedenen Größen verfügbar. So können Sie generative KI-Lösungen basierend auf Ihren verfügbaren Rechenressourcen, den benötigten Funktionen und der Umgebung erstellen, in der Sie sie ausführen möchten. Jedes Modell ist in einer abgestimmten und einer nicht abgestimmten Version verfügbar:

Vortrainiert: Diese Version des Modells wurde nicht mit bestimmten Aufgaben oder Anweisungen über das Trainings-Dataset Gemma-Kerndaten trainiert. Wir empfehlen, dieses Modell nicht ohne Abstimmung zu verwenden.
Anleitung abgestimmt – Diese Version des Modells wurde mit Interaktionen in menschlicher Sprache trainiert, damit es an einer Unterhaltung teilnehmen kann, ähnlich wie ein einfacher Chatbot.
Mix-Feinabstimmung: Diese Version des Modells wurde mit einer Mischung aus akademischen Datasets optimiert und akzeptiert Prompts in natürlicher Sprache.

Niedrigere Parametergrößen bedeuten geringere Ressourcenanforderungen und mehr Flexibilität bei der Bereitstellung.

Modellname	Parametergröße	Eingabe	Ausgabe	Abgestimmte Versionen	Vorhergesehene Plattformen
Gemma 3n
Gemma 3n E4B	4 Milliarden effektive Parameter	Text, Bild und Audio	Text	Vortrainiert Anleitungsabgestimmt	Mobilgeräte und Laptops
Gemma 3n E2B	2 Milliarden effektive Parameter	Text, Bild und Audio	Text	Vortrainiert Anleitungsabgestimmt	Mobilgeräte und Laptops
Gemma 3
Gemma 27B	27 Milliarden	Text und Bild	Text	Vortrainiert Anleitungsabgestimmt	Große Server oder Servercluster
Gemma 12B	12 Milliarden	Text und Bild	Text	Vortrainiert Anleitungsabgestimmt	Hochwertige Computer und Server
Gemma 4B	4 Milliarden	Text und Bild	Text	Vortrainiert Anleitungsabgestimmt	Computer und kleine Server
Gemma 1B	1 Milliarde	Text	Text	Vortrainiert Anleitungsabgestimmt	Mobilgeräte und Laptops
Gemma 2
Gemma 27B	27 Milliarden	Text	Text	Vortrainiert Anleitungsabgestimmt	Große Server oder Servercluster
Gemma 9B	9 Milliarden	Text	Text	Vortrainiert Anleitungsabgestimmt	Hochwertige Computer und Server
Gemma 2B	2 Milliarden	Text	Text	Vortrainiert Anleitungsabgestimmt	Mobilgeräte und Laptops
Gemma
Gemma 7B	7 Milliarden	Text	Text	Vortrainiert Anleitungsabgestimmt	Computer und kleine Server
Gemma 2B	2,2 Milliarden	Text	Text	Vortrainiert Anleitungsabgestimmt	Mobilgeräte und Laptops
CodeGemma
CodeGemma 7B	7 Milliarden	Text	Text	Vortrainiert Anleitungsabgestimmt	Computer und kleine Server
CodeGemma 2B	2 Milliarden	Text	Text	Vortrainiert	Computer und kleine Server
PaliGemma 2
PaliGemma 28B	28 Milliarden	Text und Bild	Text	Vortrainiert Mix optimiert	Große Server oder Servercluster
PaliGemma 10B	10 Milliarden	Text und Bild	Text	Vortrainiert Mix optimiert	Hochwertige Computer und Server
PaliGemma 3B	3 Milliarden	Text und Bild	Text	Vortrainiert Mix optimiert	Computer und kleine Server
PaliGemma
PaliGemma 3B	3 Milliarden	Text und Bild	Text	Vortrainiert Mix optimiert	Computer und kleine Server
ShieldGemma 2
ShieldGemma 2	4 Milliarden	Text und Bild	Text	Abgestimmt	Computer und kleine Server
TxGemma
TxGemma 27B	27 Milliarden	Text	Text	Vortrainiert Anleitungsabgestimmt	Große Server oder Servercluster
TxGemma 9B	9 Milliarden	Text	Text	Vortrainiert Anleitungsabgestimmt	Hochwertige Computer und Server
TxGemma 2B	2 Milliarden	Text	Text	Vortrainiert	Mobilgeräte und Laptops
MedGemma
MedGemma 27B	27 Milliarden	Text und Bild	Text	Nur Text, anleitungsabgestimmt Anleitungsabgestimmt	Große Server oder Servercluster
MedGemma 4B	4 Milliarden	Text und Bild	Text	Vortrainiert Anleitungsabgestimmt	Computer und kleine Server
MedSigLIP
MedSigLIP	800 Millionen	Text und Bild	Einbettung	Abgestimmt	Mobilgeräte und Laptops
T5Gemma
T5Gemma 9B-9B	18 Milliarden	Text	Text	PrefixLM, vortrainiert PrefixLM, anleitungsabgestimmt UL2, vortrainiert UL2, anleitungsabgestimmt	Mobilgeräte und Laptops
T5Gemma 9B-2B	11 Milliarden	Text	Text	PrefixLM, vortrainiert PrefixLM, anleitungsabgestimmt UL2, vortrainiert UL2, anleitungsabgestimmt	Mobilgeräte und Laptops
T5Gemma 2B-2B	4 Milliarden	Text	Text	PrefixLM, vortrainiert PrefixLM, anleitungsabgestimmt UL2, vortrainiert UL2, anleitungsabgestimmt	Mobilgeräte und Laptops
T5Gemma XL-XL	4 Milliarden	Text	Text	PrefixLM, vortrainiert PrefixLM, anleitungsabgestimmt UL2, vortrainiert UL2, anleitungsabgestimmt	Mobilgeräte und Laptops
T5Gemma M-L	2 Milliarden	Text	Text	PrefixLM, vortrainiert PrefixLM, anleitungsabgestimmt UL2, vortrainiert UL2, anleitungsabgestimmt	Mobilgeräte und Laptops
T5Gemma L-L	1 Milliarde	Text	Text	PrefixLM, vortrainiert PrefixLM, anleitungsabgestimmt UL2, vortrainiert UL2, anleitungsabgestimmt	Mobilgeräte und Laptops
T5Gemma B-B	0,6 Milliarden	Text	Text	PrefixLM, vortrainiert PrefixLM, anleitungsabgestimmt UL2, vortrainiert UL2, anleitungsabgestimmt	Mobilgeräte und Laptops
T5Gemma S-S	0,3 Milliarden	Text	Text	PrefixLM, vortrainiert PrefixLM, anleitungsabgestimmt UL2, vortrainiert UL2, anleitungsabgestimmt	Mobilgeräte und Laptops

Gemma wurde mit der maßgeschneiderten V5e-TPU-Hardware von Google und der NVIDIA L4(G2-Standard), A100(A2-Standard) und H100(A3-High)-GPU-Hardware getestet.

Nächste Schritte

Weitere Informationen finden Sie in der Gemma-Dokumentation.