Los playgrounds se basan en endpoints de predicción online de Vertex AI preconfigurados y no conllevan ningún cargo. Cuando abras la tarjeta de un modelo compatible, podrás usar el panel Probar para comprobar rápidamente las funciones del modelo enviando una petición de texto. También puedes definir algunos de los parámetros más habituales, como la temperatura y el número de tokens de salida. El playground solo permite introducir y mostrar texto.
Cuando lanzas Spaces, tienes una aplicación web funcional que está lista para usar con mucho menos esfuerzo manual que desplegar un modelo y crear una aplicación para usar el endpoint del modelo. Model Garden despliega el modelo seleccionado en Vertex AI y la aplicación de ejemplo en una instancia de Cloud Run que usa el endpoint del modelo desplegado. La aplicación también puede usar puntos finales que ya tenga o un punto final de MaaS.
Para lanzar un modelo, abre la tarjeta del modelo compatible y, en el panel Probar espacios, haz clic en un espacio para lanzarlo. Se te cobrará por las máquinas que se usen para el despliegue y por la instancia de Cloud Run que aloje la aplicación.
Antes de empezar
Para seguir este tutorial, debes configurar un Google Cloud proyecto y habilitar la API Vertex AI.
- Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
Roles required to select or create a project
- Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
-
Create a project: To create a project, you need the Project Creator
(
roles/resourcemanager.projectCreator
), which contains theresourcemanager.projects.create
permission. Learn how to grant roles.
-
Verify that billing is enabled for your Google Cloud project.
-
Enable the Vertex AI API.
Roles required to enable APIs
To enable APIs, you need the Service Usage Admin IAM role (
roles/serviceusage.serviceUsageAdmin
), which contains theserviceusage.services.enable
permission. Learn how to grant roles. -
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
Roles required to select or create a project
- Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
-
Create a project: To create a project, you need the Project Creator
(
roles/resourcemanager.projectCreator
), which contains theresourcemanager.projects.create
permission. Learn how to grant roles.
-
Verify that billing is enabled for your Google Cloud project.
-
Enable the Vertex AI API.
Roles required to enable APIs
To enable APIs, you need the Service Usage Admin IAM role (
roles/serviceusage.serviceUsageAdmin
), which contains theserviceusage.services.enable
permission. Learn how to grant roles. En la consola Google Cloud , ve a la tarjeta de modelo de un modelo compatible, como la tarjeta de modelo Gemma 2.
En el panel Probar:
- En Región, acepta el valor predeterminado o elige tu región.
- En Endpoint (Endpoint), selecciona Demo playground (Playground de demostración).
- En el cuadro Petición, escribe
Why is the sky blue?
. - Expande la sección Opciones avanzadas y consulta los parámetros predeterminados.
Haz clic en Enviar. El resultado aparece debajo del botón Enviar.
- Generación de subtítulos de imágenes con BLIP
- BLIP VQA
- BLIP2
- Flux
- Gemma 2
- Gemma 3
- Gemini 2.5 Flash
- Gemini 2.5 Pro
- Instant ID
- Llama 3.2
- Llama 3.3
- Llama 4
- Llama 3.2 90B
- Llama 4 Maverick 17B-128E
- LLaVA 1.5 y LLaVA-NeXT
- Mistral Self-host (7B y Nemo)
- PaliGemma 1 y 2
- Phi-3
- Phi-4
- Qwen2
- Pintura en la imagen de Stable Diffusion
- Stable Diffusion v2.1
- Stable Diffusion XL LCM
- Stable Diffusion XL Lightning
- Stable Diffusion XL
- DeepSeek R1 (0528)
- API Admin de Cloud Run (
run.googleapis.com
) - API de Artifact Registry (
artifactregistry.googleapis.com
) - API de Cloud Build (
cloudbuild.googleapis.com
) - API de Cloud Logging (
logging.googleapis.com
) -
Agente de servicio de Vertex AI
(
roles/aiplatform.serviceAgent
) -
Cuenta de servicio de Cloud Build
(
roles/cloudbuild.builds.builder
) storage.buckets.create
run.services.create
artifactregistry.repositories.create
run.services.setIamPolicy
En la Google Cloud consola, ve a Model Garden para ver la tarjeta de un modelo.
Selecciona el modelo que quieras usar. Los modelos compatibles tienen un panel Probar Espacios, como la tarjeta del modelo Gemma 3.
Haz clic en rocket_launch Ejecutar para iniciar un espacio.
- Puedes requerir autenticación (a través de Identity Aware Proxy) o permitir el acceso público. Para obtener más información, consulta Habilitar APIs para la primera implementación y conceder permisos.
- Haz clic en Crear nuevo servicio para iniciar la implementación. Puedes monitorizar el estado de la implementación desde la tarjeta del modelo.
Cuando el estado de Espacios cambie a Listo, haz clic en él para ver los detalles de la implementación.
Para disfrutar de una protección básica, la aplicación web requiere una clave secreta que debe añadirse a la URL al enviar peticiones. Esta clave secreta se proporciona en el campo Clave secreta.
- Haz clic en Abrir para empezar a usar la aplicación. Puedes enviar peticiones al modelo y ver sus respuestas desde la aplicación.
Puedes compartir la URL para que otros usuarios también puedan probar la aplicación.
- Para cerrar el acceso a la aplicación, haz clic en Editar en el campo Control de acceso.
En la pestaña Seguridad de tu aplicación de Cloud Run, selecciona Requerir autenticación y, a continuación, haz clic en Guardar. La aplicación ya no está disponible a través de la URL. Las visitas a la URL devuelven un error 403 (prohibido).
En la Google Cloud consola, consulta la lista de servicios de Cloud Run:
Busca el servicio que quieras eliminar y selecciónalo.
Haz clic en Eliminar Eliminar. De esta forma, se eliminan todas las revisiones del servicio.
- In the Google Cloud console, go to the Manage resources page.
- In the project list, select the project that you want to delete, and then click Delete.
- In the dialog, type the project ID, and then click Shut down to delete the project.
Probar un Playground
Probar Espacios
Puedes lanzar espacios con modelos como Gemini, Gemma, Llama y Stable Diffusion. La siguiente lista es un ejemplo de lo que se admite:
Permisos de gestión de identidades y accesos
Además de los permisos que ya tienes para usar Vertex AI, debes tener los siguientes para lanzar Espacios:
Acción | Permisos obligatorios | Finalidad |
---|---|---|
Habilitar APIs adicionales | serviceusage.services.enable |
Habilita las siguientes APIs:
|
Otorgar permisos a cuentas de servicio | resourcemanager.projects.setIamPolicy |
Concede los siguientes roles a la
cuenta de servicio predeterminada de Compute Engine:
|
Implementar permisos específicos |
|
Durante la implementación, se subirá un conjunto de códigos fuente a Cloud Storage y, a continuación, se implementará en Cloud Run con un nuevo servicio creado. El artifactregistry.repositories.create es
obligatorio para crear un repositorio de la imagen de contenedor. El
run.services.setIamPolicy es necesario para que el servicio sea de
acceso público.
|
Si eres el propietario de tu proyecto, no tienes que hacer nada más, solo seguir las guías de Vertex AI Studio. Si no eres el propietario de tu proyecto, pide al administrador del proyecto que realice las dos primeras acciones y, a continuación, que te conceda los roles Editor (roles/editor
) y Administrador de Cloud Run (roles/run.admin
).
Lanzar espacios
Inicia un espacio para probar y experimentar con un modelo de una aplicación de Gradio de ejemplo.
Limpieza
Para evitar que se apliquen cargos en tu Google Cloud cuenta por los recursos utilizados en esta página, sigue estos pasos.
Eliminar espacios
Para limpiar los espacios, debes eliminar los recursos del modelo y los de la aplicación de ejemplo en Cloud Run.
Eliminar recursos de modelos
Desde la aplicación Gradio, puedes eliminar endpoints de modelos para limpiar los recursos de Vertex AI. A continuación, debes eliminar el servicio de Cloud Run para detener y eliminar la aplicación Gradio.
Para eliminar manualmente recursos de Vertex AI, consulta Retirar modelos y eliminar recursos.
Eliminar servicio de Cloud Run
Elimina los recursos relacionados con un servicio, incluidas todas las revisiones del servicio. Al eliminar un servicio, no se incluyen elementos como las imágenes de contenedor de Artifact Registry. Para obtener más información, consulta el artículo Gestionar servicios de la documentación de Cloud Run.
Eliminar el proyecto
La forma más fácil de evitar que te cobren es eliminar el proyecto que has creado para el tutorial.
Para ello, sigue las instrucciones que aparecen a continuación:
Siguientes pasos
Consulta una descripción general de Model Garden.