Modelos administrados por Vertex AI para MaaS

Vertex AI admite una lista seleccionada de modelos abiertos y de socios como modelos administrados. Estos modelos se pueden usar con Vertex AI como un modelo como servicio (MaaS) y se ofrecen como una API administrada. Cuando usas un modelo administrado, continúas enviando tus solicitudes a los extremos de Vertex AI. Los modelos administrados no tienen servidores, por lo que no es necesario aprovisionar ni administrar la infraestructura.

Los modelos administrados se pueden descubrir con Model Garden. También puedes implementar modelos con Model Garden. Para obtener más información, consulta Explora los modelos de IA en Model Garden.

Modelos de socios

Los siguientes modelos de socios se ofrecen como APIs administradas en Vertex AI Model Garden (MaaS):

Nombre del modelo Modalidad Descripción Guía de inicio rápido
Claude Sonnet 4.5 Lenguaje, Vision Es el modelo de tamaño mediano de Anthropic para potenciar agentes del mundo real, con capacidades en programación, uso de computadoras, ciberseguridad y trabajo con archivos de Office, como hojas de cálculo. Tarjeta de modelo
Claude Opus 4.1 Lenguaje, Vision Es líder en la industria de la programación. Ofrece un rendimiento sostenido en tareas de larga duración que requieren un esfuerzo concentrado y miles de pasos, lo que expande significativamente lo que pueden resolver los agentes de IA. Ideal para potenciar productos y funciones de agentes avanzados. Tarjeta de modelo
Claude Haiku 4.5 Lenguaje, Vision Claude Haiku 4.5 ofrece un rendimiento casi de vanguardia para una amplia variedad de casos de uso y se destaca como uno de los mejores modelos de programación del mundo, con la velocidad y el costo adecuados para potenciar los productos gratuitos y las experiencias de usuario de gran volumen. Tarjeta de modelo
Claude Opus 4 Lenguaje, Vision Claude Opus 4 ofrece un rendimiento sostenido en tareas de larga duración que requieren un esfuerzo concentrado y miles de pasos, lo que expande significativamente lo que pueden resolver los agentes de IA. Tarjeta de modelo
Claude Sonnet 4 Lenguaje, Vision Modelo de tamaño mediano de Anthropic con inteligencia superior para usos de gran volumen, como programación, investigación exhaustiva y agentes. Tarjeta de modelo
Claude 3.7 Sonnet de Anthropic Lenguaje, Vision Es el modelo líder en la industria para la codificación y el funcionamiento de agentes de IA, y el primer modelo de Claude que ofrece un pensamiento extendido. Tarjeta de modelo
Claude 3.5 Sonnet v2 de Anthropic Lenguaje, Vision Claude 3.5 Sonnet actualizado es un modelo de última generación para tareas de ingeniería de software del mundo real y capacidades de agentes. Claude 3.5 Sonnet ofrece estos avances al mismo precio y velocidad que su predecesor. Tarjeta de modelo
Claude 3.5 Haiku de Anthropic Lenguaje, Vision Claude 3.5 Haiku, la próxima generación del modelo más rápido y rentable de Anthropic, es ideal para casos de uso en los que la velocidad y la rentabilidad son importantes. Tarjeta de modelo
Claude 3 Haiku de Anthropic Idioma El modelo de visión y texto más rápido de Anthropic para respuestas casi instantáneas a consultas básicas, diseñado para experiencias de IA fluidas que imitan las interacciones humanas. Tarjeta de modelo
Claude 3.5 Sonnet de Anthropic Idioma Claude 3.5 Sonnet supera el rendimiento de Claude 3 Opus de Anthropic en una amplia variedad de evaluaciones de Anthropic, gracias a la velocidad y el costo del modelo de nivel intermedio de Anthropic, Claude 3 Sonnet. Tarjeta de modelo
Jamba 1.5 Large (versión preliminar) Idioma Jamba 1.5 Large de AI21 Labs está diseñado para ofrecer respuestas de calidad superior, un alto rendimiento y precios competitivos en comparación con otros modelos de su clase de tamaño. Tarjeta de modelo
Jamba 1.5 Mini (versión preliminar) Idioma Jamba 1.5 Mini de AI21 Labs está bien equilibrado en cuanto a calidad, rendimiento y bajo costo. Tarjeta de modelo
Mistral Medium 3 Idioma Mistral Medium 3 es un modelo versátil diseñado para una amplia variedad de tareas, como programación, razonamiento matemático, comprensión de documentos extensos, resumen y diálogo. Tarjeta de modelo
OCR de Mistral (25/05) Lenguaje, Vision Mistral OCR (25.05) es una API de reconocimiento óptico de caracteres para la comprensión de documentos. El modelo comprende cada elemento de los documentos, como contenido multimedia, texto, tablas y ecuaciones. Tarjeta de modelo
Mistral Small 3.1 (25/03) Idioma Mistral Small 3.1 (25/3) es la versión más reciente del modelo Small de Mistral, que incluye capacidades multimodales y una longitud de contexto extendida. Tarjeta de modelo
Mistral Large (24.11) Idioma Mistral Large (24.11) es la próxima versión del modelo Mistral Large (24.07), que ahora cuenta con capacidades mejoradas de razonamiento y llamadas a funciones. Tarjeta de modelo
Codestral 2 Idioma, código Codestral 2 es el modelo especializado en generación de código de Mistral creado específicamente para la finalización de relleno en el medio (FIM) de alta precisión que ayuda a los desarrolladores a escribir e interactuar con el código a través de un extremo de API compartido de instrucciones y finalización. Tarjeta de modelo
Codestral (25.01) Código Un modelo de vanguardia diseñado para la generación de código, incluida la función de completar el código en el medio y la finalización de código. Tarjeta de modelo

Modelos abiertos

Los siguientes modelos abiertos se ofrecen como APIs administradas en Vertex AI Model Garden (MaaS):

Nombre del modelo Modalidad Descripción Guía de inicio rápido
gpt-oss 120B Idioma Un modelo de 120 mil millones de parámetros que ofrece un alto rendimiento en tareas de razonamiento. Tarjeta de modelo
gpt-oss 20B Idioma Es un modelo de 20B optimizado para la eficiencia y la implementación en hardware de consumo y de borde. Tarjeta de modelo
Qwen3-Next-80B Thinking Idioma, código Es un modelo de la familia Qwen3-Next, especializado en la resolución de problemas complejos y el razonamiento profundo. Tarjeta de modelo
Qwen3-Next-80B Instruct Idioma, código Es un modelo de la familia Qwen3-Next, especializado en seguir comandos específicos. Tarjeta de modelo
Qwen3 Coder Idioma, código Es un modelo de código abierto desarrollado para tareas avanzadas de desarrollo de software. Tarjeta de modelo
Qwen3 235B Idioma Un modelo de peso abierto con capacidad de "pensamiento híbrido" para alternar entre el razonamiento metódico y la conversación rápida. Tarjeta de modelo
DeepSeek-V3.1 Idioma Modelo híbrido de DeepSeek que admite el modo de pensamiento y el modo sin pensamiento. Tarjeta de modelo
DeepSeek R1 (0528) Idioma Es la versión más reciente del modelo DeepSeek R1 de DeepSeek. Tarjeta de modelo
Llama 4 Maverick 17B-128E Lenguaje, Vision El modelo de Llama 4 más grande y potente, con capacidades de programación, razonamiento y procesamiento de imágenes. Llama 4 Maverick 17B-128E es un modelo multimodal que usa la arquitectura de mezcla de expertos (MoE) y la fusión anticipada. Tarjeta de modelo
Llama 4 Scout 17B-16E Lenguaje, Vision Llama 4 Scout 17B-16E ofrece resultados de vanguardia para su clase de tamaño, superando a las generaciones anteriores de Llama y a otros modelos abiertos y propietarios en varias comparativas. Llama 4 Scout 17B-16E es un modelo multimodal que usa la arquitectura de mezcla de expertos (MoE) y la fusión anticipada. Tarjeta de modelo
Llama 3.3 Idioma Llama 3.3 es un modelo de solo texto de 70B ajustado por instrucciones que proporciona un rendimiento mejorado en comparación con Llama 3.1 70B y Llama 3.2 90B cuando se usa para aplicaciones de solo texto. Además, para algunas aplicaciones, Llama 3.3 70B se acerca al rendimiento de Llama 3.1 405B. Tarjeta de modelo
Llama 3.2 (versión preliminar) Lenguaje, Vision Un modelo multimodal de tamaño medio de 90 B que puede admitir el razonamiento de imágenes, como el análisis de gráficos y diagramas, así como la leyenda de imágenes. Tarjeta de modelo
Llama 3.1 Idioma

Una colección de LLMs multilingües optimizados para casos de uso de diálogos multilingües que superan el rendimiento de muchos de los modelos de chat cerrados y de código abierto disponibles en comparativas comunes de la industria.

Llama 3.1 405b tiene disponibilidad general (DG).

Llama 3.1 8B y Llama 3.1 70B están en versión preliminar.

Tarjeta de modelo

¿Qué sigue?