Probar las funciones de los modelos en Model Garden

Model Garden te ofrece varias opciones para ver y probar rápidamente las funciones de los modelos. En los modelos admitidos, puedes probar las demos o lanzar aplicaciones de demostración llamadas Espacios de Model Garden, que puedes compartir con otros usuarios para mostrar las funciones de un modelo.

Los playgrounds se basan en endpoints de predicción online de Vertex AI preconfigurados y no conllevan ningún cargo. Cuando abras la tarjeta de un modelo compatible, podrás usar el panel Probar para comprobar rápidamente las funciones del modelo enviando una petición de texto. También puedes definir algunos de los parámetros más habituales, como la temperatura y el número de tokens de salida. El playground solo permite introducir y mostrar texto.

Cuando lanzas Spaces, tienes una aplicación web funcional que está lista para usar con mucho menos esfuerzo manual que desplegar un modelo y crear una aplicación para usar el endpoint del modelo. Model Garden despliega el modelo seleccionado en Vertex AI y la aplicación de ejemplo en una instancia de Cloud Run que usa el endpoint del modelo desplegado. La aplicación también puede usar puntos finales que ya tenga o un punto final de MaaS.

Para lanzar un modelo, abre la tarjeta del modelo compatible y, en el panel Probar espacios, haz clic en un espacio para lanzarlo. Se te cobrará por las máquinas que se usen para el despliegue y por la instancia de Cloud Run que aloje la aplicación.

Antes de empezar

Para seguir este tutorial, debes configurar un Google Cloud proyecto y habilitar la API Vertex AI.

  1. Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.
  2. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Roles required to select or create a project

    • Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
    • Create a project: To create a project, you need the Project Creator (roles/resourcemanager.projectCreator), which contains the resourcemanager.projects.create permission. Learn how to grant roles.

    Go to project selector

  3. Verify that billing is enabled for your Google Cloud project.

  4. Enable the Vertex AI API.

    Roles required to enable APIs

    To enable APIs, you need the Service Usage Admin IAM role (roles/serviceusage.serviceUsageAdmin), which contains the serviceusage.services.enable permission. Learn how to grant roles.

    Enable the API

  5. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Roles required to select or create a project

    • Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
    • Create a project: To create a project, you need the Project Creator (roles/resourcemanager.projectCreator), which contains the resourcemanager.projects.create permission. Learn how to grant roles.

    Go to project selector

  6. Verify that billing is enabled for your Google Cloud project.

  7. Enable the Vertex AI API.

    Roles required to enable APIs

    To enable APIs, you need the Service Usage Admin IAM role (roles/serviceusage.serviceUsageAdmin), which contains the serviceusage.services.enable permission. Learn how to grant roles.

    Enable the API

  8. Probar un Playground

    1. En la consola Google Cloud , ve a la tarjeta de modelo de un modelo compatible, como la tarjeta de modelo Gemma 2.

      Ir a Gemma 2

    2. En el panel Probar:

      1. En Región, acepta el valor predeterminado o elige tu región.
      2. En Endpoint (Endpoint), selecciona Demo playground (Playground de demostración).
      3. En el cuadro Petición, escribe Why is the sky blue?.
      4. Expande la sección Opciones avanzadas y consulta los parámetros predeterminados.

      Panel de prueba de Gemma 2b-it

    3. Haz clic en Enviar. El resultado aparece debajo del botón Enviar.

    Probar Espacios

    Puedes lanzar espacios con modelos como Gemini, Gemma, Llama y Stable Diffusion. La siguiente lista es un ejemplo de lo que se admite:

    Permisos de gestión de identidades y accesos

    Además de los permisos que ya tienes para usar Vertex AI, debes tener los siguientes para lanzar Espacios:

    Acción Permisos obligatorios Finalidad
    Habilitar APIs adicionales serviceusage.services.enable Habilita las siguientes APIs:
    • API Admin de Cloud Run (run.googleapis.com)
    • API de Artifact Registry (artifactregistry.googleapis.com)
    • API de Cloud Build (cloudbuild.googleapis.com)
    • API de Cloud Logging (logging.googleapis.com)
    Otorgar permisos a cuentas de servicio resourcemanager.projects.setIamPolicy Concede los siguientes roles a la cuenta de servicio predeterminada de Compute Engine:
    Implementar permisos específicos
    • storage.buckets.create
    • run.services.create
    • artifactregistry.repositories.create
    • run.services.setIamPolicy
    Durante la implementación, se subirá un conjunto de códigos fuente a Cloud Storage y, a continuación, se implementará en Cloud Run con un nuevo servicio creado. El artifactregistry.repositories.create es obligatorio para crear un repositorio de la imagen de contenedor. El run.services.setIamPolicy es necesario para que el servicio sea de acceso público.

    Si eres el propietario de tu proyecto, no tienes que hacer nada más, solo seguir las guías de Vertex AI Studio. Si no eres el propietario de tu proyecto, pide al administrador del proyecto que realice las dos primeras acciones y, a continuación, que te conceda los roles Editor (roles/editor) y Administrador de Cloud Run (roles/run.admin).

    Lanzar espacios

    Inicia un espacio para probar y experimentar con un modelo de una aplicación de Gradio de ejemplo.

    1. En la Google Cloud consola, ve a Model Garden para ver la tarjeta de un modelo.

      Ir a Model Garden

    2. Selecciona el modelo que quieras usar. Los modelos compatibles tienen un panel Probar Espacios, como la tarjeta del modelo Gemma 3.

      Ir a Gemma 3

    3. Haz clic en rocket_launch Ejecutar para iniciar un espacio.

      1. Puedes requerir autenticación (a través de Identity Aware Proxy) o permitir el acceso público. Para obtener más información, consulta Habilitar APIs para la primera implementación y conceder permisos.
      1. Haz clic en Crear nuevo servicio para iniciar la implementación. Puedes monitorizar el estado de la implementación desde la tarjeta del modelo.
    4. Cuando el estado de Espacios cambie a Listo, haz clic en él para ver los detalles de la implementación.

      Para disfrutar de una protección básica, la aplicación web requiere una clave secreta que debe añadirse a la URL al enviar peticiones. Esta clave secreta se proporciona en el campo Clave secreta.

      1. Haz clic en Abrir para empezar a usar la aplicación. Puedes enviar peticiones al modelo y ver sus respuestas desde la aplicación.

      Puedes compartir la URL para que otros usuarios también puedan probar la aplicación.

      1. Para cerrar el acceso a la aplicación, haz clic en Editar en el campo Control de acceso.

      En la pestaña Seguridad de tu aplicación de Cloud Run, selecciona Requerir autenticación y, a continuación, haz clic en Guardar. La aplicación ya no está disponible a través de la URL. Las visitas a la URL devuelven un error 403 (prohibido).

    Limpieza

    Para evitar que se apliquen cargos en tu Google Cloud cuenta por los recursos utilizados en esta página, sigue estos pasos.

    Eliminar espacios

    Para limpiar los espacios, debes eliminar los recursos del modelo y los de la aplicación de ejemplo en Cloud Run.

    Eliminar recursos de modelos

    Desde la aplicación Gradio, puedes eliminar endpoints de modelos para limpiar los recursos de Vertex AI. A continuación, debes eliminar el servicio de Cloud Run para detener y eliminar la aplicación Gradio.

    Para eliminar manualmente recursos de Vertex AI, consulta Retirar modelos y eliminar recursos.

    Eliminar servicio de Cloud Run

    Elimina los recursos relacionados con un servicio, incluidas todas las revisiones del servicio. Al eliminar un servicio, no se incluyen elementos como las imágenes de contenedor de Artifact Registry. Para obtener más información, consulta el artículo Gestionar servicios de la documentación de Cloud Run.

    1. En la Google Cloud consola, consulta la lista de servicios de Cloud Run:

      Ir a Cloud Run

    2. Busca el servicio que quieras eliminar y selecciónalo.

    3. Haz clic en Eliminar Eliminar. De esta forma, se eliminan todas las revisiones del servicio.

    Eliminar el proyecto

    La forma más fácil de evitar que te cobren es eliminar el proyecto que has creado para el tutorial.

    Para ello, sigue las instrucciones que aparecen a continuación:

    1. In the Google Cloud console, go to the Manage resources page.

      Go to Manage resources

    2. In the project list, select the project that you want to delete, and then click Delete.
    3. In the dialog, type the project ID, and then click Shut down to delete the project.

    Siguientes pasos

    Consulta una descripción general de Model Garden.