Vertex AI Model Optimizer

Vertex AI Model Optimizer ist ein dynamischer Endpunkt, der die Modellauswahl vereinfacht, indem automatisch das Gemini-Modell angewendet wird, das Ihren Anforderungen am besten entspricht. So können Sie Ihre Prompts auf einen einzelnen Meta-Endpunkt richten und der Dienst wählt anhand Ihrer Kosten- und Qualitätseinstellungen intelligent das am besten geeignete Gemini-Modell für Ihre Anfrage aus (Pro, Flash usw.).

Weitere Informationen zu den Preisen für Model Optimizer finden Sie unter Preise.

Vorteile

Mit Model Optimizer haben Sie folgende Möglichkeiten:

  • Modellauswahl vereinfachen, anstatt ein Modell für jede Anwendung auszuwählen
  • Sie können die Optimierung auf Kosten, Qualität oder beides ausrichten und so Leistung und Budget in Einklang bringen.
  • Nahtlose Integration in bestehende Gemini APIs und SDKs
  • Nutzung verfolgen und Einsparpotenzial identifizieren
  • Textbasierte Aufgaben effizient erledigen, ohne dass Endpunkte manuell ausgewählt werden müssen

Unterstützte Modelle

  • Gemini 2.0 Flash (allgemein verfügbar)
  • Gemini 2.5 Pro (Vorabversion, 25.03.)

Sprachunterstützung

Model Optimizer unterstützt alle Sprachen, die auch von den Gemini-Modellen unterstützt werden. (siehe „Gemini-Sprachunterstützung“)

Modalität

Model Optimizer unterstützt Textanwendungsfälle, darunter:

  • Programmierung, einschließlich Funktionsaufrufen und Codeausführung
  • Zusammenfassung
  • Chat mit einer oder mehreren Antworten
  • Question Answering

Informationen zu Einschränkungen und deren Behandlung finden Sie unter Nicht unterstützte Funktionen behandeln.

Erste Schritte

Colab-Notebook für den schnellen Einstieg

Vertex AI Model Optimizer verwenden

Python

Installieren

pip install --upgrade google-genai

Weitere Informationen finden Sie in der SDK-Referenzdokumentation.

Umgebungsvariablen für die Verwendung des Gen AI SDK mit Vertex AI festlegen:

# Replace the `GOOGLE_CLOUD_PROJECT` and `GOOGLE_CLOUD_LOCATION` values
# with appropriate values for your project.
export GOOGLE_CLOUD_PROJECT=GOOGLE_CLOUD_PROJECT
export GOOGLE_CLOUD_LOCATION=global
export GOOGLE_GENAI_USE_VERTEXAI=True

#     from google import genai
#     from google.genai.types import (
#         FeatureSelectionPreference,
#         GenerateContentConfig,
#         HttpOptions,
#         ModelSelectionConfig
#     )
#
#     client = genai.Client(http_options=HttpOptions(api_version="v1beta1"))
#     response = client.models.generate_content(
#         model="model-optimizer-exp-04-09",
#         contents="How does AI work?",
#         config=GenerateContentConfig(
#             model_selection_config=ModelSelectionConfig(
#                 feature_selection_preference=FeatureSelectionPreference.BALANCED  # Options: PRIORITIZE_QUALITY, BALANCED, PRIORITIZE_COST
#             ),
#         ),
#     )
#     print(response.text)
#     # Example response:
#     # Okay, let's break down how AI works. It's a broad field, so I'll focus on the ...
#     #
#     # Here's a simplified overview:
#     # ...

Nicht unterstützte Funktionen

Model Optimizer unterstützt nur Text als Eingabe und Ausgabe. Die Anfrage kann jedoch verschiedene Modalitäten oder Tools enthalten, die nicht unterstützt werden. In den folgenden Abschnitten wird beschrieben, wie Model Optimizer diese nicht unterstützten Funktionen verarbeitet.

Multimodale Anfragen

Anfragen mit Prompts, die multimodale Daten wie Video, Bilder oder Audio enthalten, führen zu einem INVALID_ARGUMENT-Fehler.

Nicht unterstützte Tools

Model Optimizer unterstützt nur die Funktionsdeklaration für Anfragen. Wenn eine Anfrage andere Tooltypen wie google_maps, google_search, enterprise_web_search, retrieval oder browse enthält, wird ein INVALID_ARGUMENT-Fehler ausgegeben.

Feedback geben

Wenn Sie Feedback zu Model Optimizer geben möchten, füllen Sie bitte unsere Feedbackumfrage aus.

Bei Fragen, technischen Problemen oder Feedback zu Model Optimizer wenden Sie sich an model-optimizer-support@google.com.

Kundendiskussionsgruppe

Treten Sie der Vertex AI Model Optimizer-Lerngruppe bei, um direkt mit dem Entwicklungsteam in Kontakt zu treten. Dort können Sie das Produkt kennenlernen und uns dabei helfen, die Funktionen für Sie zu optimieren. Die Gruppe umfasst folgende Aktivitäten:

  • Virtuelle Workshops mit weiteren Informationen zu den Funktionen
  • Feedback-Umfragen zum Mitteilen Ihrer Bedürfnisse und Prioritäten
  • 1:1-Sitzungen mit Google Cloud -Mitarbeitern, während wir neue Funktionen entwickeln

Die Aktivitäten werden etwa alle 6 bis 8 Wochen angeboten. Sie können so viele oder so wenige Teilnehmer nehmen, wie Sie möchten, oder Sie können dies jederzeit deaktivieren. Wenn Sie der Gruppe beitreten möchten, füllen Sie das Anmeldeformular für die Vertex AI Model Optimizer-Diskussionsgruppe aus.