Gemini für AutoML Text-Nutzer

Auf dieser Seite finden Sie Vergleiche zwischen AutoML Text und Gemini, damit AutoML Text-Nutzer die Verwendung von Gemini besser verstehen können.

Prüfen Sie die Tabellen, die für Ihren Anwendungsfall gelten, und prüfen Sie die Änderungen, die sich wahrscheinlich auf Ihren Workflow auswirken.

Allgemeine Verwendung

Diese Unterschiede gelten für alle Gemini-Nutzer.

Vorgang AutoML Text Gemini
Trainingsdatenformate Sie haben die Möglichkeit, mit CSV- oder JSON Lines-Dateien Inline-Text-Snippets einzubinden oder auf Dokumente vom Typ TXT zu verweisen. Dies gilt nicht für die Extraktion von Textentitäten. Die Entitätsextraktion unterstützt nur JSON Lines-Dateien. Sie können nur JSON Lines-Dateien verwenden. Jede Zeile in der Datei sollte ein einzelnes Trainingsbeispiel enthalten. Sie können einen Beispieldatensatz für die Feinabstimmung von Gemini-Modellen herunterladen. Dateien sollten in Cloud Storage gespeichert werden.
Dataset-Annotation Anmerkungen werden als ein AnnotationSet-Objekt gruppiert. Sie können verschiedene Annotationssätze mit demselben Dataset verwenden. Dataset-Annotationen gelten nicht für Gemini.
Dataset-Import ML-Nutzungswerte werden entweder in einer optionalen Spalte für CSV, in derselben Zeile wie die Daten oder als Tag in JSON Lines im gleichen JSON-Objekt wie die Daten angegeben. Wenn Sie keine ML-Nutzungswerte angeben, werden die Daten automatisch für Training, Tests und Validierung aufgeteilt.
Für die Sentimentanalyse müssen CSV-Dateien den Sentimentwert in der letzten Spalte jeder Zeile enthalten.
Sie benötigen zwei separate JSONL-Dateien, eine für das Training und eine für die Validierung. Die Validierungsdatei ist optional. Die Validierungsdatei sollte 10 bis 256 Beispiele enthalten.
Speicherkosten Wenn Sie ein Dataset erstellen, werden Ihre Daten in Cloud Storage in Ihr Projekt geladen. Für diesen Speicher entstehen Kosten. Weitere Informationen Wenn Sie ein Dataset erstellen, werden Ihre Daten in Cloud Storage in Ihr Projekt geladen. Für diesen Speicher entstehen Kosten. Weitere Informationen
Daten-Labeling Anleitungen zur Labelverteilung können Sie über eine URL bereitstellen. Annotationen sind Teil des Dataset-Objekts und können mit der API nicht bearbeitet werden. Daten-Labeling ist bei Gemini nicht möglich.
Modellbereitstellung Sie erstellen ein Endpunkt-Objekt, das Ressourcen für Bereitstellungen von Onlinevorhersagen bietet. Anschließend stellen Sie das Modell auf dem Endpunkt bereit. Rufen Sie die Methode predict() auf, um Vorhersagen anzufragen. Nach der Feinabstimmung von Gemini wird das Modell in der Vertex AI Model Registry gespeichert und ein Endpunkt wird automatisch erstellt. Onlinevorhersagen aus dem optimierten Modell können mit dem Python SDK, der REST API oder der Console angefordert werden. Sie fordern Vorhersagen an, indem Sie zuerst den optimierten Endpunkt abrufen und dann die Methode generate_content() verwenden.
Projektnummer oder Projekt-ID verwenden Sowohl project-number als auch project-id funktionieren in Vertex AI. Gemini verwendet project-id.
Konfidenzwerte AutoML Text unterstützt Konfidenzwerte. In Gemini werden keine Konfidenzbewertungen unterstützt.

API-Nutzer

Ausführliche Informationen zur API finden Sie in der Referenzdokumentation zur Vertex AI Generative AI Tuning API.

Vorgang oder Entität AutoML Text Gemini
Modellerstellung Sie erstellen ein TrainingPipeline-Objekt, das einen Trainingsjob zurückgibt. Sie erstellen einen Job für die überwachte Feinabstimmung, der den Abstimmungsjob zurückgibt.
Clientbibliothek verwenden Für jede API-Ressource gibt es verschiedene API-Clients. Sie können einen überwachten Feinabstimmungsjob für Gemini mit dem Python SDK, der REST API oder der Console erstellen.
Vorhersagen anfordern Sie fordern Vorhersagen an, indem Sie die Methode predict() für die Endpunktressource aufrufen. Sie fordern Vorhersagen an, indem Sie zuerst den optimierten Endpunkt abrufen und dann die Methode generate_content verwenden.
Endpunkt von Onlinevorhersagen Ersetzen Sie im Folgenden REGION durch die Region, in der sich Ihr Vorhersagemodell befindet.
REGION-aiplatform.googleapis.com. Beispiel:
us-central1-aiplatform.googleapis.com
Ersetzen Sie im Folgenden TUNING_JOB_REGION durch die Region, in der der Abstimmungsjob ausgeführt wird.
TUNING_JOB_REGION-aiplatform.googleapis.com. Beispiel:
us-central1-aiplatform.googleapis.com
Schema- und Definitionsdateien Einige Anfrage- und Antwortfelder sind in Schema- und Definitionsdateien definiert. Datenformate werden mit vordefinierten Schemadateien definiert. Dies ermöglicht die Flexibilität für die API und die Datenformate. Der Anfragetext, die Modellparameter und der Antworttext sind mit denen der nicht abgestimmten Gemini-Modelle identisch. Beispielanfragen
Hostname aiplatform.googleapis.com aiplatform.googleapis.com
Regionaler Hostname Erforderlich. Beispiel:
us-central1-aiplatform.googleapis.com
Erforderlich. Beispiel:
us-central1-aiplatform.googleapis.com

Nächste Schritte