Model Garden es una biblioteca de modelos de IA y aprendizaje automático que te ayuda a descubrir, probar, personalizar y desplegar modelos y recursos de Google y de partners de Google.
Ventajas de Model Garden
Cuando trabajas con modelos de IA, Model Garden te ofrece las siguientes ventajas:
- Todos los modelos disponibles están agrupados en una sola ubicación
- Model Garden proporciona un patrón de implementación coherente para diferentes tipos de modelos
- Model Garden ofrece una integración integrada con otras partes de Vertex AI, como el ajuste, la evaluación y el servicio de modelos.
- Servir modelos de IA generativa puede ser difícil. Vertex AI se encarga del despliegue y del servicio de modelos
Descubrir modelos
Para ver la lista de modelos fundacionales, ajustables y específicos para tareas de Vertex AI y de código abierto, ve a la página Model Garden en laGoogle Cloud consola.
Las categorías de modelos disponibles en Model Garden son las siguientes:
Categoría | Descripción |
---|---|
Modelos fundacionales | Modelos multitarea de gran tamaño preentrenados que se pueden ajustar o personalizar para tareas específicas con Vertex AI Studio, la API de Vertex AI y el SDK de Vertex AI para Python. |
Modelos que se pueden optimizar | Modelos que puedes ajustar con un cuaderno o una pipeline personalizados. |
Soluciones específicas para tareas | La mayoría de estos modelos precompilados están listos para usarse. Muchos se pueden personalizar con sus propios datos. |
Para filtrar modelos en el panel de filtros, especifica lo siguiente:
- Tareas: haz clic en la tarea que quieras que realice el modelo.
- Colecciones de modelos: haz clic para elegir modelos gestionados por Google, partners o tú.
- Proveedores: haz clic en el proveedor del modelo.
- Funciones: haz clic en las funciones que quieras incluir en el modelo.
Para obtener más información sobre cada modelo, haz clic en su tarjeta.
Para ver una lista de los modelos disponibles en Model Garden, consulta Modelos disponibles en Model Garden.
Análisis de seguridad de modelos
Google realiza pruebas y comparativas exhaustivas en los contenedores de servicio y ajuste que proporcionamos. El análisis activo de vulnerabilidades también se aplica a los artefactos de contenedor.
Los modelos de terceros de partners destacados se someten a análisis de puntos de control de modelos para garantizar su autenticidad. Hugging Face analiza directamente los modelos de terceros de Hugging Face Hub y su analizador de terceros para detectar malware, archivos pickle, capas Lambda de Keras y secretos. Hugging Face marca los modelos que se consideran no seguros en estos análisis y bloquea su implementación en Model Garden. Los modelos que se consideren sospechosos o que tengan la capacidad de ejecutar código remoto se indican en Model Garden, pero se pueden desplegar igualmente. Te recomendamos que revises a fondo cualquier modelo sospechoso antes de implementarlo en Model Garden.
Precios
En el caso de los modelos de código abierto de Model Garden, se te cobra por usar lo siguiente en Vertex AI:
- Ajuste de modelos: se te cobra por los recursos de computación utilizados al mismo precio que el entrenamiento personalizado. Consulta los precios de la formación personalizada.
- Despliegue de modelos: se te cobra por los recursos de computación que se usan para desplegar el modelo en un endpoint. Consulta los precios de las predicciones.
- Colab Enterprise: consulta los precios de Colab Enterprise.
Controlar el acceso a modelos específicos
Puedes definir una política de organización de Model Garden a nivel de organización, carpeta o proyecto para controlar el acceso a modelos específicos de Model Garden. Por ejemplo, puedes permitir el acceso a modelos específicos que hayas verificado y denegar el acceso a todos los demás.
Más información sobre Model Garden
Para obtener más información sobre las opciones de implementación y las personalizaciones que puedes hacer con los modelos de Model Garden, consulta los recursos de las siguientes secciones, que incluyen enlaces a tutoriales, referencias, cuadernos y vídeos de YouTube.
Desplegar y servir
Consulta más información sobre cómo personalizar las implementaciones y las funciones avanzadas de servicio.
- Desplegar y servir un modelo de código abierto con el SDK de Python, la CLI, la API REST o la consola
- Vídeo de YouTube sobre cómo implementar y ajustar Gemma 3 en Model Garden
- Implementar Gemma y hacer predicciones
- Servir modelos abiertos con un contenedor Hex-LLM en TPUs de Cloud
- Desplegar modelos Llama con el cuaderno del tutorial de Hex-LLM
- Usar el almacenamiento en caché de prefijos y la decodificación especulativa con el cuaderno del tutorial de Hex-LLM o vLLM
- Usar vLLM para servir modelos de lenguaje de solo texto y multimodelos en GPUs de Cloud
- Usar el contenedor de servicio de GPU xDiT para generar imágenes y vídeos
- Tutorial sobre cómo servir Gemma 2 con varios adaptadores LoRA con HuggingFace DLC para la inferencia de PyTorch en Medium
- Usar identificadores personalizados para ofrecer PaliGemma para subtitulado de imágenes con el tutorial de inferencia de HuggingFace DLC para PyTorch en LinkedIn
- Desplegar y servir un modelo que use máquinas virtuales de Spot o un cuaderno de tutorial de reserva de Compute Engine
- Desplegar y ofrecer un modelo de Hugging Face
Cumplimiento de los contenedores
Model Garden ofrece los siguientes contenedores que cumplen los requisitos de FedRAMP High para el servicio de modelos.
Ajuste
Consulta más información sobre cómo ajustar modelos para adaptar las respuestas a casos prácticos específicos.
- Cuaderno del tutorial de ajuste fino de Workbench
- Cuaderno de tutorial sobre ajuste y evaluación
- Vídeo de YouTube sobre cómo implementar y ajustar Gemma 3 en Model Garden
Evaluación
Más información sobre cómo evaluar las respuestas de los modelos con Vertex AI
Recursos adicionales
- Notebooks de Model Garden específicos para modelos y recorridos de usuario
- Cuadernos de servicio, ajuste y evaluación de modelos abiertos de Vertex AI