Die Modellabstimmung ist ein wichtiger Prozess bei der Anpassung von Gemini, um bestimmte Aufgaben mit höherer Präzision und Genauigkeit auszuführen. Bei der Modellabstimmung wird einem Modell ein Trainings-Dataset bereitgestellt, das eine Reihe von Beispielen für bestimmte nachgelagerte Aufgaben enthält.
Diese Seite bietet einen Überblick über die Modellabstimmung für Gemini, beschreibt die für Gemini verfügbaren Abstimmungsoptionen und hilft Ihnen dabei, festzustellen, wann die einzelnen Abstimmungsoptionen verwendet werden sollten.
Vorteile der Modellabstimmung
Die Modellabstimmung ist eine effektive Möglichkeit, große Modelle an Ihre Aufgaben anzupassen. Dies ist ein wichtiger Schritt, um die Qualität und Effizienz des Modells zu verbessern. Die Modellabstimmung bietet folgende Vorteile:
- Höhere Qualität für Ihre spezifischen Aufgaben.
- Erhöhte Robustheit des Modells.
- Niedrigere Inferenzlatenz und Kosten aufgrund kürzerer Prompts.
Abstimmung im Vergleich zum Prompt-Design
Die Abstimmung bietet folgende Vorteile gegenüber dem Prompt-Design.
- Sie ermöglicht eine tiefgreifende Anpassung des Modells und führt zu einer besseren Leistung bei bestimmten Aufgaben.
- Sie bietet einheitlichere und zuverlässigere Ergebnisse.
- Sie kann eine größere Anzahl von Beispielen gleichzeitig verarbeiten.
Parametereffiziente Abstimmung
Die parametereffiziente Abstimmung, auch Adapterabstimmung genannt, ermöglicht eine effiziente Anpassung großer Modelle an Ihre spezifischen Aufgaben oder Bereiche. Bei der parametereffizienten Abstimmung wird eine relativ kleine Teilmenge der Modellparameter während des Abstimmungsprozesses aktualisiert.
Weitere Informationen dazu, wie Vertex AI die Adapterabstimmung und -bereitstellung unterstützt, finden Sie im folgenden Whitepaper Anpassung großer Basismodelle.
Parametereffiziente Abstimmung im Vergleich zur vollständigen Feinabstimmung
Parametereffiziente Abstimmung und vollständige Feinabstimmung sind zwei Ansätze zum Anpassen großer Modelle. Beide Methoden haben ihre Vorteile und Auswirkungen in Bezug auf die Modellqualität und Ressourceneffizienz.
Bei der vollständigen Feinabstimmung werden alle Parameter des Modells aktualisiert. Sie eignet sich daher zur Anpassung des Modells an hoch komplexe Aufgaben, wodurch eine höhere Qualität erzielt werden kann. Eine vollständige Feinabstimmung erfordert jedoch höhere Rechenressourcen sowohl für die Abstimmung als auch für die Bereitstellung, was zu höheren Gesamtkosten führt.
Die parametereffiziente Abstimmung ist im Vergleich zur vollständigen Feinabstimmung ressourceneffizienter und kostengünstiger. Dabei werden deutlich geringere Rechenressourcen zum Trainieren benötigt. Mit ihr kann das Modell mit einem kleineren Dataset schneller angepasst werden. Die Flexibilität der parametereffizienten Abstimmung bietet eine Lösung für das Multi-Task-Lernen, ohne dass ein umfassendes erneutes Training erforderlich ist.
Vertex AI unterstützt die parametereffiziente Abstimmung und die vollständige Feinabstimmung für verschiedene Modelle in verschiedenen Szenarien.
Gemini-Modelle abstimmen
Die folgenden Gemini-Modelle unterstützen die überwachte Abstimmung mit parametereffizienter Abstimmung:
gemini-1.0-pro-002
Die überwachte Feinabstimmung ist eine gute Option, wenn Sie eine klar definierte Aufgabe mit verfügbaren, mit Labels versehenen Daten haben. Sie ist besonders effektiv bei domainspezifischen Anwendungen, bei denen sich die Sprache oder der Inhalt erheblich von den Daten unterscheiden, mit denen das große Modell ursprünglich trainiert wurde.
Bei der überwachten Abstimmung wird das Modellverhalten mit einem mit Labels versehenen Dataset angepasst. Bei diesem Prozess wird die Gewichtung des Modells angepasst, um den Unterschied zwischen den Vorhersagen und den tatsächlichen Labels zu minimieren. Dies kann die Modellleistung für die folgenden Aufgabentypen verbessern:
- Klassifizierung
- Sentimentanalyse
- Entitätsextraktion
- Zusammenfassung von nicht komplexen Inhalten
- Domainspezifische Abfragen schreiben
Kontingent für die Abstimmung von Gemini-Modellen
Das Kontingent wird für die Anzahl der gleichzeitigen Abstimmungsjobs erzwungen. Jedes Projekt verfügt über ein Standardkontingent, mit dem mindestens ein Abstimmungsjob ausgeführt werden kann. Dies ist ein globales Kontingent, das von allen verfügbaren Regionen gemeinsam genutzt wird. Wenn Sie weitere Jobs gleichzeitig ausführen möchten, müssen Sie für Global concurrent tuning jobs
zusätzliche Kontingente anfordern.
Nächste Schritte
Informationen zum Vorbereiten von Abstimmungsdaten finden Sie unter Überwachte Abstimmungsdaten vorbereiten.
Informationen zum Verwenden der überwachten Abstimmung in einer Lösung, die eine Wissensdatenbank mit generativer KI erstellt, finden Sie unter Schnellstartlösung: Wissensdatenbank für generative KI.