Vertex AI Model Optimizer es un extremo dinámico diseñado para simplificar la selección de modelos, ya que aplica automáticamente el modelo de Gemini que mejor se adapta a tus necesidades. Esto te permite dirigir tus instrucciones a un solo extremo de metadatos, y el servicio selecciona de forma inteligente el modelo de Gemini más adecuado para tu búsqueda (Pro, Flash, etcétera) según tus preferencias de costo y calidad.
Para obtener más información sobre los precios de Model Optimizer, consulta Precios.
Beneficios
Model Optimizer te permite hacer lo siguiente:
- Simplifica la selección de modelos en lugar de elegir uno para cada aplicación
- Puedes optimizar la campaña para que se centre en el costo, la calidad o ambos, lo que te permite equilibrar el rendimiento y el presupuesto.
- Se integra sin problemas con las APIs y los SDKs de Gemini existentes
- Realiza un seguimiento del uso e identifica el potencial de ahorro de costos
- Maneja de manera eficiente las tareas basadas en texto sin necesidad de seleccionar manualmente un extremo.
Modelos compatibles
- Gemini 2.0 Flash (DG)
- Gemini 2.5 Pro (versión preliminar, 25/3)
Idiomas admitidos
Model Optimizer admite todos los idiomas que también admiten los modelos de Gemini. (Consulta Compatibilidad con idiomas de Gemini)
Modalidad
El Model Optimizer admite casos de uso de texto, incluidos los siguientes:
- Codificación, incluida la llamada a funciones y la ejecución de código
- Resúmenes
- Chat de un solo turno y de varios turnos
- Preguntas y respuestas
Para conocer las limitaciones y cómo controlarlas, consulta Cómo controlar las funciones no admitidas.
Cómo comenzar
Para comenzar a usar Model Optimizer, consulta nuestro notebook de Colab de inicio rápido.
Usa Vertex AI Model Optimizer
Python
Instalar
pip install --upgrade google-genai
Para obtener más información, consulta la documentación de referencia del SDK.
Establece variables de entorno para usar el SDK de IA generativa con Vertex AI:
# Replace the `GOOGLE_CLOUD_PROJECT` and `GOOGLE_CLOUD_LOCATION` values # with appropriate values for your project. export GOOGLE_CLOUD_PROJECT=GOOGLE_CLOUD_PROJECT export GOOGLE_CLOUD_LOCATION=global export GOOGLE_GENAI_USE_VERTEXAI=True
Cómo controlar las funciones no admitidas
Model Optimizer solo admite entrada y salida de texto. Sin embargo, la solicitud podría incluir diferentes modalidades o herramientas que no se admiten. En las siguientes secciones, se explica cómo Model Optimizer controla estas funciones no admitidas.
Solicitudes multimodales
Las solicitudes que incluyan instrucciones con datos multimodales, como videos, imágenes o audio, arrojarán un error INVALID_ARGUMENT
.
Herramientas no compatibles
El Model Optimizer solo admite la declaración de funciones para las solicitudes. Si una solicitud contiene otros tipos de herramientas, incluidos google_maps
, google_search
, enterprise_web_search
, retrieval
o browse
, se arroja un error INVALID_ARGUMENT
.
Enviar comentarios
Para enviar comentarios sobre tu experiencia con Model Optimizer, completa nuestra encuesta de opinión.
Si tienes preguntas, problemas técnicos o comentarios sobre Model Optimizer, comunícate con model-optimizer-support@google.com.
Grupo de discusión con clientes
Para conectarte directamente con el equipo de desarrollo, puedes unirte al grupo de escucha de Vertex AI Model Optimizer, en el que puedes aprender sobre el producto y ayudarnos a comprender cómo mejorar las funciones para ti. Las actividades del grupo incluyen lo siguiente:
- Talleres virtuales para obtener más información sobre las funciones
- Encuestas de comentarios para compartir tus necesidades y prioridades
- Sesiones individuales con Google Cloud empleados a medida que exploramos funciones nuevas
Las actividades se ofrecen alrededor de una vez cada 6 a 8 semanas. Puedes participar en todas las que quieras, o puedes dejar de participar por completo en cualquier momento. Para unirte al grupo, completa el formulario de registro del grupo de debate de Vertex AI Model Optimizer.