Vertex AI Model Optimizer ist ein dynamischer Endpunkt, der die Modellauswahl vereinfacht, indem automatisch das Gemini-Modell angewendet wird, das Ihren Anforderungen am besten entspricht. So können Sie Ihre Prompts auf einen einzelnen Meta-Endpunkt richten und der Dienst wählt anhand Ihrer Kosten- und Qualitätseinstellungen intelligent das am besten geeignete Gemini-Modell für Ihre Anfrage aus (Pro, Flash usw.).
Weitere Informationen zu den Preisen für Model Optimizer finden Sie unter Preise.
Vorteile
Mit Model Optimizer haben Sie folgende Möglichkeiten:
- Modellauswahl vereinfachen, anstatt ein Modell für jede Anwendung auszuwählen
- Sie können die Optimierung auf Kosten, Qualität oder beides ausrichten und so Leistung und Budget in Einklang bringen.
- Nahtlose Integration in bestehende Gemini APIs und SDKs
- Nutzung verfolgen und Einsparpotenzial identifizieren
- Textbasierte Aufgaben effizient erledigen, ohne dass Endpunkte manuell ausgewählt werden müssen
Unterstützte Modelle
- Gemini 2.0 Flash (allgemein verfügbar)
- Gemini 2.5 Pro (Vorabversion, 25.03.)
Sprachunterstützung
Model Optimizer unterstützt alle Sprachen, die auch von den Gemini-Modellen unterstützt werden. (siehe „Gemini-Sprachunterstützung“)
Modalität
Model Optimizer unterstützt Textanwendungsfälle, darunter:
- Programmierung, einschließlich Funktionsaufrufen und Codeausführung
- Zusammenfassung
- Chat mit einer oder mehreren Antworten
- Question Answering
Informationen zu Einschränkungen und deren Behandlung finden Sie unter Nicht unterstützte Funktionen behandeln.
Erste Schritte
Colab-Notebook für den schnellen Einstieg
Vertex AI Model Optimizer verwenden
Python
Installieren
pip install --upgrade google-genai
Weitere Informationen finden Sie in der SDK-Referenzdokumentation.
Umgebungsvariablen für die Verwendung des Gen AI SDK mit Vertex AI festlegen:
# Replace the `GOOGLE_CLOUD_PROJECT` and `GOOGLE_CLOUD_LOCATION` values # with appropriate values for your project. export GOOGLE_CLOUD_PROJECT=GOOGLE_CLOUD_PROJECT export GOOGLE_CLOUD_LOCATION=global export GOOGLE_GENAI_USE_VERTEXAI=True
Nicht unterstützte Funktionen
Model Optimizer unterstützt nur Text als Eingabe und Ausgabe. Die Anfrage kann jedoch verschiedene Modalitäten oder Tools enthalten, die nicht unterstützt werden. In den folgenden Abschnitten wird beschrieben, wie Model Optimizer diese nicht unterstützten Funktionen verarbeitet.
Multimodale Anfragen
Anfragen mit Prompts, die multimodale Daten wie Video, Bilder oder Audio enthalten, führen zu einem INVALID_ARGUMENT
-Fehler.
Nicht unterstützte Tools
Model Optimizer unterstützt nur die Funktionsdeklaration für Anfragen. Wenn eine Anfrage andere Tooltypen wie google_maps
, google_search
, enterprise_web_search
, retrieval
oder browse
enthält, wird ein INVALID_ARGUMENT
-Fehler ausgegeben.
Feedback geben
Wenn Sie Feedback zu Model Optimizer geben möchten, füllen Sie bitte unsere Feedbackumfrage aus.
Bei Fragen, technischen Problemen oder Feedback zu Model Optimizer wenden Sie sich an model-optimizer-support@google.com.
Kundendiskussionsgruppe
Treten Sie der Vertex AI Model Optimizer-Lerngruppe bei, um direkt mit dem Entwicklungsteam in Kontakt zu treten. Dort können Sie das Produkt kennenlernen und uns dabei helfen, die Funktionen für Sie zu optimieren. Die Gruppe umfasst folgende Aktivitäten:
- Virtuelle Workshops mit weiteren Informationen zu den Funktionen
- Feedback-Umfragen zum Mitteilen Ihrer Bedürfnisse und Prioritäten
- 1:1-Sitzungen mit Google Cloud -Mitarbeitern, während wir neue Funktionen entwickeln
Die Aktivitäten werden etwa alle 6 bis 8 Wochen angeboten. Sie können so viele oder so wenige Teilnehmer nehmen, wie Sie möchten, oder Sie können dies jederzeit deaktivieren. Wenn Sie der Gruppe beitreten möchten, füllen Sie das Anmeldeformular für die Vertex AI Model Optimizer-Diskussionsgruppe aus.