Vertex AI Model Optimizer

Vertex AI Model Optimizer es un extremo dinámico diseñado para simplificar la selección de modelos, ya que aplica automáticamente el modelo de Gemini que mejor se adapta a tus necesidades. Esto te permite dirigir tus instrucciones a un solo extremo de metadatos, y el servicio selecciona de forma inteligente el modelo de Gemini más adecuado para tu búsqueda (Pro, Flash, etcétera) según tus preferencias de costo y calidad.

Para obtener más información sobre los precios de Model Optimizer, consulta Precios.

Beneficios

Model Optimizer te permite hacer lo siguiente:

  • Simplifica la selección de modelos en lugar de elegir uno para cada aplicación
  • Puedes optimizar la campaña para que se centre en el costo, la calidad o ambos, lo que te permite equilibrar el rendimiento y el presupuesto.
  • Se integra sin problemas con las APIs y los SDKs de Gemini existentes
  • Realiza un seguimiento del uso e identifica el potencial de ahorro de costos
  • Maneja de manera eficiente las tareas basadas en texto sin necesidad de seleccionar manualmente un extremo.

Modelos compatibles

  • Gemini 2.0 Flash (DG)
  • Gemini 2.5 Pro (versión preliminar, 25/3)

Idiomas admitidos

Model Optimizer admite todos los idiomas que también admiten los modelos de Gemini. (Consulta Compatibilidad con idiomas de Gemini)

Modalidad

El Model Optimizer admite casos de uso de texto, incluidos los siguientes:

  • Codificación, incluida la llamada a funciones y la ejecución de código
  • Resúmenes
  • Chat de un solo turno y de varios turnos
  • Preguntas y respuestas

Para conocer las limitaciones y cómo controlarlas, consulta Cómo controlar las funciones no admitidas.

Cómo comenzar

Para comenzar a usar Model Optimizer, consulta nuestro notebook de Colab de inicio rápido.

Usa Vertex AI Model Optimizer

Python

Instalar

pip install --upgrade google-genai

Para obtener más información, consulta la documentación de referencia del SDK.

Establece variables de entorno para usar el SDK de IA generativa con Vertex AI:

# Replace the `GOOGLE_CLOUD_PROJECT` and `GOOGLE_CLOUD_LOCATION` values
# with appropriate values for your project.
export GOOGLE_CLOUD_PROJECT=GOOGLE_CLOUD_PROJECT
export GOOGLE_CLOUD_LOCATION=global
export GOOGLE_GENAI_USE_VERTEXAI=True

#     from google import genai
#     from google.genai.types import (
#         FeatureSelectionPreference,
#         GenerateContentConfig,
#         HttpOptions,
#         ModelSelectionConfig
#     )
#
#     client = genai.Client(http_options=HttpOptions(api_version="v1beta1"))
#     response = client.models.generate_content(
#         model="model-optimizer-exp-04-09",
#         contents="How does AI work?",
#         config=GenerateContentConfig(
#             model_selection_config=ModelSelectionConfig(
#                 feature_selection_preference=FeatureSelectionPreference.BALANCED  # Options: PRIORITIZE_QUALITY, BALANCED, PRIORITIZE_COST
#             ),
#         ),
#     )
#     print(response.text)
#     # Example response:
#     # Okay, let's break down how AI works. It's a broad field, so I'll focus on the ...
#     #
#     # Here's a simplified overview:
#     # ...

Cómo controlar las funciones no admitidas

Model Optimizer solo admite entrada y salida de texto. Sin embargo, la solicitud podría incluir diferentes modalidades o herramientas que no se admiten. En las siguientes secciones, se explica cómo Model Optimizer controla estas funciones no admitidas.

Solicitudes multimodales

Las solicitudes que incluyan instrucciones con datos multimodales, como videos, imágenes o audio, arrojarán un error INVALID_ARGUMENT.

Herramientas no compatibles

El Model Optimizer solo admite la declaración de funciones para las solicitudes. Si una solicitud contiene otros tipos de herramientas, incluidos google_maps, google_search, enterprise_web_search, retrieval o browse, se arroja un error INVALID_ARGUMENT.

Enviar comentarios

Para enviar comentarios sobre tu experiencia con Model Optimizer, completa nuestra encuesta de opinión.

Si tienes preguntas, problemas técnicos o comentarios sobre Model Optimizer, comunícate con model-optimizer-support@google.com.

Grupo de discusión con clientes

Para conectarte directamente con el equipo de desarrollo, puedes unirte al grupo de escucha de Vertex AI Model Optimizer, en el que puedes aprender sobre el producto y ayudarnos a comprender cómo mejorar las funciones para ti. Las actividades del grupo incluyen lo siguiente:

  • Talleres virtuales para obtener más información sobre las funciones
  • Encuestas de comentarios para compartir tus necesidades y prioridades
  • Sesiones individuales con Google Cloud empleados a medida que exploramos funciones nuevas

Las actividades se ofrecen alrededor de una vez cada 6 a 8 semanas. Puedes participar en todas las que quieras, o puedes dejar de participar por completo en cualquier momento. Para unirte al grupo, completa el formulario de registro del grupo de debate de Vertex AI Model Optimizer.