Modelos abiertos de Vertex AI para MaaS

Vertex AI admite una lista seleccionada de modelos abiertos como modelos administrados. Estos modelos abiertos se pueden usar con Vertex AI como un modelo como servicio (MaaS) y se ofrecen como una API administrada. Cuando usas un modelo abierto administrado, continúas enviando tus solicitudes a los extremos de Vertex AI. Los modelos abiertos administrados no tienen servidores, por lo que no es necesario aprovisionar ni administrar la infraestructura.

Los modelos abiertos administrados se pueden descubrir con Model Garden. También puedes implementar modelos con Model Garden. Para obtener más información, consulta Explora los modelos de IA en Model Garden.

Antes de usar modelos abiertos, debes otorgar acceso de usuario a los modelos abiertos.

Modelos abiertos

Los siguientes modelos abiertos se ofrecen como APIs administradas en Vertex AI Model Garden (MaaS):

Nombre del modelo Modalidad Descripción Guía de inicio rápido
gpt-oss 120B Idioma Un modelo de 120 mil millones de parámetros que ofrece un alto rendimiento en tareas de razonamiento. Tarjeta de modelo
gpt-oss 20B Idioma Es un modelo de 20B optimizado para la eficiencia y la implementación en hardware de consumo y de borde. Tarjeta de modelo
Qwen3-Next-80B Thinking Idioma, código Es un modelo de la familia Qwen3-Next, especializado en la resolución de problemas complejos y el razonamiento profundo. Tarjeta de modelo
Qwen3-Next-80B Instruct Idioma, código Es un modelo de la familia Qwen3-Next, especializado en seguir comandos específicos. Tarjeta de modelo
Qwen3 Coder Idioma, código Es un modelo de código abierto desarrollado para tareas avanzadas de desarrollo de software. Tarjeta de modelo
Qwen3 235B Idioma Un modelo de peso abierto con capacidad de "pensamiento híbrido" para alternar entre el razonamiento metódico y la conversación rápida. Tarjeta de modelo
DeepSeek-V3.1 Idioma Modelo híbrido de DeepSeek que admite el modo de pensamiento y el modo sin pensamiento. Tarjeta de modelo
DeepSeek R1 (0528) Idioma Es la versión más reciente del modelo DeepSeek R1 de DeepSeek. Tarjeta de modelo
Llama 4 Maverick 17B-128E Lenguaje, Vision El modelo de Llama 4 más grande y potente, con capacidades de programación, razonamiento y procesamiento de imágenes. Llama 4 Maverick 17B-128E es un modelo multimodal que usa la arquitectura de mezcla de expertos (MoE) y la fusión anticipada. Tarjeta de modelo
Llama 4 Scout 17B-16E Lenguaje, Vision Llama 4 Scout 17B-16E ofrece resultados de vanguardia para su clase de tamaño, superando a las generaciones anteriores de Llama y a otros modelos abiertos y propietarios en varias comparativas. Llama 4 Scout 17B-16E es un modelo multimodal que usa la arquitectura de mezcla de expertos (MoE) y la fusión anticipada. Tarjeta de modelo
Llama 3.3 Idioma Llama 3.3 es un modelo de solo texto de 70B ajustado por instrucciones que proporciona un rendimiento mejorado en comparación con Llama 3.1 70B y Llama 3.2 90B cuando se usa para aplicaciones de solo texto. Además, para algunas aplicaciones, Llama 3.3 70B se acerca al rendimiento de Llama 3.1 405B. Tarjeta de modelo
Llama 3.2 (versión preliminar) Lenguaje, Vision Un modelo multimodal de tamaño medio de 90 B que puede admitir el razonamiento de imágenes, como el análisis de gráficos y diagramas, así como la leyenda de imágenes. Tarjeta de modelo
Llama 3.1 Idioma

Una colección de LLMs multilingües optimizados para casos de uso de diálogos multilingües que superan el rendimiento de muchos de los modelos de chat cerrados y de código abierto disponibles en comparativas comunes de la industria.

Llama 3.1 405b tiene disponibilidad general (DG).

Llama 3.1 8B y Llama 3.1 70B están en versión preliminar.

Tarjeta de modelo

Los siguientes modelos de incorporación abiertos se ofrecen como APIs administradas en Vertex AI Model Garden (MaaS):

Nombre del modelo Descripción Dimensiones de salida Longitud máxima de la secuencia Lenguajes de texto admitidos Guía de inicio rápido
multilingual-e5-small Es parte de la familia de modelos de embedding de texto E5. La variante pequeña contiene 12 capas. Hasta 384 512 tokens Idiomas admitidos Tarjeta de modelo
multilingual-e5-large Es parte de la familia de modelos de embedding de texto E5. La variante grande contiene 24 capas. Hasta 1,024 512 tokens Idiomas admitidos Tarjeta de modelo

Cumplimiento de las reglamentaciones del modelo abierto

Las certificaciones de la IA generativa en Vertex AI siguen siendo válidas cuando se usan modelos abiertos como una API administrada con Vertex AI. Si necesitas detalles sobre los modelos, puedes encontrar información adicional en la tarjeta del modelo correspondiente o comunicarte con el editor del modelo respectivo.

Tus datos se almacenan en reposo dentro de la región o multirregión seleccionada para los modelos abiertos en Vertex AI, pero la regionalización del procesamiento de datos puede variar. Para obtener una lista detallada de los compromisos de procesamiento de datos de los modelos abiertos, consulta Residencia de datos para modelos abiertos.

Las instrucciones del cliente y las respuestas del modelo no se comparten con terceros cuando se usa la API de Vertex AI, incluidos los modelos abiertos. Google solo trata los datos del cliente según las instrucciones del cliente, lo que se describe con más detalle en nuestro Anexo de Tratamiento de Datos de Cloud.

¿Qué sigue?