Model Garden es una biblioteca de modelos de AA/ML que te ayuda a descubrir, probar, personalizar e implementar modelos y recursos de Google y sus socios.
Ventajas de Model Garden
Cuando trabajas con modelos de IA, Model Garden proporciona las siguientes ventajas:
- Los modelos disponibles se agrupan en una sola ubicación.
- Model Garden proporciona un patrón de implementación coherente para diferentes tipos de modelos.
- Model Garden proporciona integración integrada con otras partes de Vertex AI, como el ajuste, la evaluación y la entrega de modelos.
- La entrega de modelos de IA generativa puede ser difícil. Vertex AI se encarga de la implementación y la entrega de modelos por ti.
Explora modelos
Para ver la lista de modelos de base ajustables y específicos para tareas de código abierto y de Vertex AI, ve a la página Model Garden en laGoogle Cloud consola.
Las categorías de modelos disponibles en Model Garden son las siguientes:
Categoría | Descripción |
---|---|
Modelos de base | Modelos grandes multitarea previamente entrenados que se pueden ajustar o personalizar para tareas específicas mediante Generative AI Studio, la API de Vertex AI y el SDK de Vertex AI para Python. |
Modelos ajustables | Modelos que puedes ajustar mediante un notebook o una canalización personalizados. |
Soluciones específicas para tareas | La mayoría de estos modelos precompilados están listos para usar. Muchos se pueden personalizar con tus propios datos. |
Para filtrar modelos en el panel de filtro, especifica lo siguiente:
- Tareas: haz clic en la tarea que deseas que realice el modelo.
- Colecciones de modelos: Haz clic para elegir modelos que administren Google, socios o tú.
- Proveedores: Haz clic en el proveedor del modelo.
- Atributos: Haz clic en los atributos que desees en el modelo.
Para obtener más información sobre cada modelo, haz clic en la tarjeta del modelo.
Para obtener una lista de los modelos disponibles en Model Garden, consulta Modelos disponibles en Model Garden.
Análisis de seguridad del modelo
Google realiza pruebas y comparativas exhaustivas en los contenedores de servicio y ajuste que proporcionamos. El análisis de vulnerabilidades activo también se aplica a los artefactos de contenedores.
Los modelos de terceros de socios destacados se someten a análisis de puntos de control para garantizar su autenticidad. Hugging Face y su analizador de terceros analizan directamente los modelos de terceros de Hugging Face Hub en busca de software malicioso, archivos pickle, capas Lambda de Keras y secretos. Hugging Face marca los modelos que se consideran no seguros a partir de estos análisis y bloquea su implementación en Model Garden. En Model Garden, se indican los modelos que se consideran sospechosos o que tienen la capacidad de ejecutar código de forma remota, pero aún se pueden implementar. Te recomendamos que realices una revisión exhaustiva de cualquier modelo sospechoso antes de implementarlo en Model Garden.
Precios
En el caso de los modelos de código abierto en Model Garden, se te cobra por el uso de lo siguiente en Vertex AI:
- Ajuste de modelos: Se te cobra por los recursos de computación que se usan con la misma tarifa que el entrenamiento personalizado. Consulta los precios de entrenamiento personalizado.
- Implementación de modelos: Se te cobra por los recursos de procesamiento que se usan para implementar el modelo en un extremo. Consulta precios de las predicciones.
- Colab Enterprise: Consulta los precios de Colab Enterprise.
Controla el acceso a modelos específicos
Puedes establecer una política de organización de Model Garden a nivel de la organización, la carpeta o el proyecto para controlar el acceso a modelos específicos en Model Garden. Por ejemplo, puedes permitir el acceso a modelos específicos que hayas verificado y denegar el acceso a todos los demás.
Más información sobre Model Garden
Para obtener más información sobre las opciones de implementación y las personalizaciones que puedes realizar con los modelos en Model Garden, consulta los recursos de las siguientes secciones, que incluyen vínculos a instructivos, referencias, notebooks y videos de YouTube.
Implementación y entrega
Obtén más información para personalizar las implementaciones y las funciones avanzadas de publicación.
- Implementa y entrega un modelo de código abierto con el SDK de Python, la CLI, la API de REST o la consola
- Video de YouTube sobre la implementación y el ajuste de Gemma 3 en Model Garden
- Implementa Gemma y haz predicciones
- Entrega modelos abiertos con un contenedor de Hex-LLM en Cloud TPU
- Notebook del instructivo para implementar modelos de Llama con Hex-LLM
- Notebook del instructivo para usar el almacenamiento en caché de prefijos y la decodificación especulativa con Hex-LLM o vLLM
- Usa vLLM para entregar modelos de lenguaje solo de texto y multimodales en GPU de Cloud
- Usa el contenedor de entrega de GPU de xDiT para la generación de imágenes y videos
- Instructivo en Medium sobre la entrega de Gemma 2 usando varios adaptadores LoRA con DLC de Hugging Face para la inferencia de PyTorch
- Instructivo en LinkedIn sobre cómo usar controladores personalizados para entregar PaliGemma y subtitular imágenes con DLC de Hugging Face para la inferencia de PyTorch
- Implementa y entrega un modelo que usa VMs Spot o un notebook del instructivo de reservas de Compute Engine
- Implementa y entrega un modelo de Hugging Face
Cumplimiento de los contenedores
Model Garden ofrece los siguientes contenedores que cumplen con el nivel alto del FedRAMP para la publicación de modelos.
Ajuste
Obtén más información para ajustar modelos y adaptar las respuestas a casos de uso específicos.
- Notebook del instructivo de ajuste de Workbench
- Notebook del instructivo de ajuste y evaluación
- Video de YouTube sobre la implementación y el ajuste de Gemma 3 en Model Garden
Evaluación
Más información para evaluar las respuestas del modelo con Vertex AI
Recursos adicionales
- Notebooks de Model Garden específicos del modelo y del recorrido del usuario
- Notebooks sobre la entrega, el ajuste y la evaluación de modelos abiertos en Vertex AI