Modell neu anbinden
Sie können ein altes optimiertes Modell mit der Google Cloud Console oder programmatisch neu ausrichten. In dieser Anleitung wird beschrieben, wie Sie das Basismodell eines optimierten Modells auf die neueste Version aktualisieren.
Es ist wichtig, ein Modell neu zu begründen, da regelmäßig neue und verbesserte Basismodelle veröffentlicht werden. Sie werden oft mit größeren Datensätzen trainiert, haben eine bessere Architektur und bieten Leistungsverbesserungen. Durch die Neuausrichtung können Sie diese Verbesserungen nutzen. Beim Neuausrichten werden die empfohlenen Hyperparameter für das neue Basismodell verwendet, um eine optimale Leistung zu erzielen.
Die Modelle bison models
und gemini-1.0
verwenden ein anderes Dataset-Format als gemini-1.5 models
. Wenn Sie von einer älteren Modellversion auf gemini-1.5
umstellen, haben Sie zwei Möglichkeiten:
- Vorhandenen Datensatz weiterverwenden: Ihr älterer Tuning-Datensatz kann weiterhin mit
gemini-1.5
verwendet werden, was eine nahtlose Umstellung ermöglicht. - Neuen Datensatz erstellen: Für eine optimale Leistung mit
gemini-1.5
erstellen Sie einen neuen Datensatz in Ihrem Cloud Storage-Bucket im aktualisierten Format.
REST
Ersetzen Sie diese Werte in den folgenden Anfragedaten:
- LOCATION: Die Region, in der der Abstimmungsjob ausgeführt wird. Dies ist auch die Standardregion, in der das abgestimmte Modell hochgeladen wird.
- PROJECT_ID: Ihre Projekt-ID.
- MODEL_ID: Der Name des optimierten Modells, das Sie neu ausrichten möchten.
- TUNING_JOB_ID: Für alte Gemini-Modelle, für die „tuning_job“ verwendet wird.
- PIPELINE_JOB_NAME: Die alte Pipeline zur Optimierung von Bison-Modellen.
HTTP-Methode und URL:
POST https://REGION-aiplatform.googleapis.com/ui/projects/PROJECT_ID/locations/REGION/tuningJobs:rebaseTunedModel
JSON-Text der Anfrage:
{ "tunedModelRef": { "tuned_model": "projects/PROJECT_ID/locations/REGION/models/MODEL_ID" } }
Wenn Sie die Anfrage senden möchten, wählen Sie eine der folgenden Optionen aus:
curl
Speichern Sie den Anfragetext in einer Datei mit dem Namen request.json
und führen Sie den folgenden Befehl aus:
curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://REGION-aiplatform.googleapis.com/ui/projects/PROJECT_ID/locations/REGION/tuningJobs:rebaseTunedModel"
PowerShell
Speichern Sie den Anfragetext in einer Datei mit dem Namen request.json
und führen Sie den folgenden Befehl aus:
$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }
Invoke-WebRequest `
-Method POST `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://REGION-aiplatform.googleapis.com/ui/projects/PROJECT_ID/locations/REGION/tuningJobs:rebaseTunedModel" | Select-Object -Expand Content
Sie sollten eine JSON-Antwort ähnlich wie diese erhalten:
Google Cloud Console
So können Sie ein abgestimmtes Modell auf ein neueres Foundation Model umstellen
- Rufen Sie im Bereich „Vertex AI“ der Google Cloud Console die Seite Vertex AI Studio auf und gehen Sie zu „Tuning“.
- In der Liste der optimierten Modelle ist in der Benachrichtigungsspalte die Option Neu optimieren für Modelle zu sehen, die veraltet sind oder neu ausgerichtet werden können.
- Wähle Neu abstimmen aus.
- Wählen Sie einen Namen für das neu abgestimmte Modell aus.
- Wählen Sie im Drop-down-Menü das neue zu verwendende Basismodell aus.
- Wählen Sie die Region aus, die Sie verwenden möchten.
- Wählen Sie den Speicherort des Ausgabeverzeichnisses aus, also den Cloud Storage-Speicherort, an dem die neu formatierten Abstimmungs-Datasets gespeichert werden.
- Aktualisieren Sie den Speicherort des Datasets für die Optimierung, indem Sie eine neue Datei in Cloud Storage hochladen oder einen vorhandenen Cloud Storage-Pfad verwenden.
- Optional: Aktivieren Sie die Modellvalidierung und stellen Sie eine Verbindung zum Cloud Storage-Validierungs-Dataset her.
- Klicken Sie auf Abstimmung starten.
Nächste Schritte
- Informationen zum Optimieren eines Modells finden Sie unter Gemini-Modelle mithilfe der überwachten Feinabstimmung optimieren.
- Informationen dazu, wie die überwachte Feinabstimmung in einer Lösung verwendet werden kann, die eine Wissensdatenbank für generative KI erstellt, finden Sie unter Schnellstartlösung: Wissensdatenbank für generative KI.