Die überwachte Feinabstimmung ist eine gute Option, wenn Sie eine klar definierte Aufgabe mit verfügbaren, mit Labels versehenen Daten haben. Sie ist besonders effektiv bei domainspezifischen Anwendungen, bei denen sich die Sprache oder der Inhalt erheblich von den Daten unterscheiden, mit denen das große Modell ursprünglich trainiert wurde.
Bei der überwachten Feinabstimmung wird das Modellverhalten mit einem mit Labels versehenen Dataset angepasst. Bei diesem Prozess wird die Gewichtung des Modells angepasst, um den Unterschied zwischen den Vorhersagen und den tatsächlichen Labels zu minimieren. Beispielsweise kann damit die Modellleistung für die folgenden Arten von Aufgaben verbessert werden:
- Klassifizierung
- Zusammenfassung
- Extraktives Question Answering
- Chat
Unterstützte Modelle
Die folgenden Gemini-Modelle unterstützen die überwachte Abstimmung:
gemini-1.0-pro-002
.
Anwendungsfälle für die Verwendung der überwachten Abstimmung von Textmodellen
Foundation-Textmodelle funktionieren gut, wenn die erwartete Ausgabe oder Aufgabe in einem Prompt klar und präzise definiert werden kann und der Prompt konsistent die erwartete Ausgabe erzeugt. Wenn Sie möchten, dass ein Modell bestimmte Nischenthemen oder Besonderheiten lernt, die von den allgemeinen Sprachmustern abweichen, sollten Sie das Modell entsprechend abstimmen. Sie können das Modell zum Beispiel mithilfe der Modellabstimmung Folgendes antrainieren:
- Bestimmte Strukturen oder Formate zum Generieren einer Ausgabe.
- Spezifisches Verhalten, z. B. wenn eine grobe oder ausführliche Ausgabe bereitgestellt werden soll.
- Bestimmte benutzerdefinierte Ausgaben für bestimmte Eingabetypen angeben.
Bei den folgenden Beispielen handelt es sich um Anwendungsfälle, die sich nur schwer mit Eingabeaufforderungen erfassen lassen:
Klassifizierung: Die erwartete Antwort ist ein bestimmtes Wort oder eine bestimmte Wortgruppe.
Durch Abstimmung des Modells kann verhindert werden, dass das Modell ausführliche Antworten generiert.
Zusammenfassung: Die Zusammenfassung folgt einem bestimmten Format. Es kann beispielsweise vorkommen, dass Sie personenidentifizierbare Informationen aus einer Chatzusammenfassung entfernen müssen.
Das Format der Ersetzung der Namen der Sprecher durch
#Person1
und#Person2
ist schwierig zu beschreiben. Das Foundation Model erzeugt möglicherweise keine solche Antwort.Antwort auf Extraktionsfrage: Die Frage bezieht sich auf einen Kontext und die Antwort ist ein Teilstring des Kontexts.
Die Antwort "Last Glacial Maximum" ist eine spezifische Wortgruppe aus dem Kontext.
Chat: Sie müssen die Modellantwort anpassen, damit sie einer Identität, einer Rolle oder einem Zeichen genügt.
Sie können ein Modell auch in folgenden Situationen optimieren:
- Prompts führen nicht konsistent zu den erwarteten Ergebnissen.
- Die Aufgabe ist zu kompliziert, um sie in einem Prompt zu definieren. Beispiel: Das Modell soll ein Verhalten klonen, das nur schwer in einem Prompt zu beschreiben ist.
- Sie haben komplexe Ahnungen über eine Aufgabe, die leicht zu erahnen, aber schwierig in einem Prompt zu formalisieren ist.
- Sie möchten die Beispiele für Schnellerstellungen entfernen, um die Kontextlänge zu reduzieren.
Kontingent
Das Kontingent wird für die Anzahl der gleichzeitigen Abstimmungsjobs erzwungen. Jedes Projekt kommt mit einem Standardkontingent zum Ausführen mindestens eines Abstimmungsjobs. Dies ist ein globales Kontingent, das von allen verfügbaren Regionen gemeinsam genutzt wird. Wenn Sie weitere Jobs gleichzeitig ausführen möchten, müssen Sie für Global concurrent tuning jobs
zusätzliche Kontingente anfordern.
Preise
Die überwachte Feinabstimmung für gemini-1.0-pro-002
befindet sich in der Vorschau.
- Während die Feinabstimmung in der Vorschau ist, fallen für die Feinabstimmung eines Modells keine Gebühren an.
- Nach der Abstimmung eines Modells fallen aber Inferenzkosten für das feinabgestimmte Modell an. Die Inferenzpreise sind für alle stabilen Versionen von Gemini 1.0 Pro gleich.
Weitere Informationen finden Sie unter Vertex AI-Preise und Verfügbare stabile Gemini-Modellversionen.