Guía de inicio rápido: desplegar una petición de Vertex AI Studio como aplicación web

En Vertex AI Studio, puedes diseñar y repetir tus peticiones, así como comparar los resultados de diferentes configuraciones y modelos. Cuando termines de diseñar tu petición, podrás implementarla como una aplicación web para compartirla con tus colaboradores o usuarios objetivo y permitirles probarla. La aplicación web está alojada en Cloud Run y está disponible fuera de la consola Google Cloud .

En esta guía de inicio rápido, harás lo siguiente:

  • Crear una petición con variables de petición
  • Desplegar tu petición como aplicación web
  • Monitorizar el progreso del despliegue y probar la aplicación desplegada
  • Actualiza y vuelve a implementar tu petición
  • Probar el envío de peticiones con asistencia multimodal

Antes de empezar

Si nunca has usado Vertex AI Studio, puedes seguir otra guía de inicio rápido o hacer el curso de Acelerador de conocimientos de Google Cloud para aprender los conceptos básicos de Vertex AI Studio. En esta guía, debes tener lo siguiente:

  1. Un proyecto de Google Cloud con la facturación y la API Vertex AI habilitadas.
  2. Los roles necesarios para desplegar una petición de Vertex AI Studio como aplicación web. Si has creado un proyecto para seguir esta guía, ya tienes los permisos necesarios.

También puedes asegurarte de que la cuenta de servicio predeterminada de Compute Engine tenga los roles necesarios para la cuenta de servicio de implementación. Si tienes permiso para conceder roles, puedes concederlos al implementar tu aplicación.

Roles obligatorios

Para obtener los permisos que necesitas para desplegar una petición de Vertex AI Studio como aplicación web, pide a tu administrador que te conceda los siguientes roles de gestión de identidades y accesos en tu proyecto:

Para obtener más información sobre cómo conceder roles, consulta el artículo Gestionar el acceso a proyectos, carpetas y organizaciones.

También puedes conseguir los permisos necesarios a través de roles personalizados u otros roles predefinidos.

Roles necesarios para la cuenta de servicio de implementación

Para asegurarte de que la cuenta de servicio predeterminada de Compute Engine tiene los permisos necesarios para ejecutar compilaciones en tu nombre, pide a tu administrador que conceda a la cuenta de servicio predeterminada de Compute Engine los siguientes roles de gestión de identidades y accesos en tu proyecto:

Para obtener más información sobre cómo conceder roles, consulta el artículo Gestionar el acceso a proyectos, carpetas y organizaciones.

Es posible que tu administrador también pueda conceder los permisos necesarios a la cuenta de servicio predeterminada de Compute Engine a través de roles personalizados u otros roles predefinidos.

Si tienes permiso para conceder roles, puedes concederlos al implementar tu aplicación.

Crear una petición con variables de petición

Ve a la página de creación de peticiones de Vertex AI Studio y, a continuación, haz clic en Añadir variable en el cuadro de entrada de la petición.

En el cuadro de diálogo Gestionar variables de petición, introduce un nombre de variable y asigna un valor. A continuación, haz clic en Aplicar.

Gestionar variables de peticiones
dialog

En el cuadro de entrada de la petición, escribe la petición con la variable y, a continuación, ajusta otros parámetros. Por ejemplo, puedes habilitar Fundamentación con la Búsqueda de Google y usar "Siempre obtén el tiempo actual de la Web" como instrucciones del sistema.

Desplegar tu petición como aplicación web

Para implementar tu petición como aplicación web, haz clic en el botón Crear con código, situado en la esquina superior derecha. A continuación, haz clic en Desplegar como aplicación.

Haz clic en el botón de crear con código y, a continuación, en desplegar como aplicación.

Guardar la petición

Aparecerá el cuadro de diálogo de confirmación para guardar, ya que es necesario guardar la petición antes de poder implementarla. El cuadro de diálogo de implementación se abrirá automáticamente una vez que se haya guardado la petición.

Guarda la petición antes de
implementarla

Habilitar las APIs para la primera implementación y conceder permisos

  1. Una vez que se haya guardado la petición, continuará el proceso de implementación. Si es la primera vez que implementas una aplicación, verás un cuadro de diálogo para habilitar las APIs necesarias. Haz clic en Habilitar las APIs necesarias.
  2. Una vez que las APIs estén habilitadas, aparecerá el cuadro de diálogo Crear una aplicación web. Puedes elegir entre Autenticación obligatoria (a través de Identity-Aware Proxy) o Permitir acceso público.
    • Si se elige la autenticación obligatoria, sigue la guía para conceder acceso (inclúyete a ti mismo).
    • Si se elige la opción de permitir el acceso público, significa que cualquier persona puede acceder a la aplicación. Por lo tanto, no incluyas información sensible ni información personal identificable (IPI) en tu petición. Marca la casilla I understand this app will be deployed publicly (Entiendo que esta aplicación se implementará públicamente) para confirmar.
  3. Haz clic en Crear aplicación para iniciar la implementación.
  4. Si es la primera vez que realizas un despliegue, aparecerá otro cuadro de diálogo en el que se te pedirá que concedas los roles necesarios a la cuenta de servicio. Haz clic en Dar todos para continuar.

Empieza la implementación

Vertex AI Studio creará un archivo ZIP que contendrá el código fuente de la aplicación web y lo subirá a un segmento de Cloud Storage. Una vez que se inicie la implementación, aparecerá el cuadro de diálogo Gestionar aplicación web con información sobre la implementación, como el nombre de la aplicación, la fecha de la última implementación, el estado de la implementación, etc.

Cuadro de diálogo de gestión de aplicaciones

Monitorizar el estado del despliegue

El despliegue tarda entre 2 y 3 minutos en completarse, y el estado se muestra en la columna Estado del cuadro de diálogo Gestionar aplicación web. Si cierras el cuadro de diálogo Gestionar aplicación web, puedes volver a abrirlo desde el menú situado debajo del botón Crear con código.

Una vez que se haya completado la implementación, la columna de estado cambiará a Listo y aparecerá el botón Abrir junto al nombre de la aplicación.

El botón Abrir aplicación aparece junto al nombre de la aplicación.

Control de acceso y clave secreta

Tu aplicación web se ha implementado con el control de acceso Permitir sin autenticación habilitado de forma predeterminada. Para desactivarla, haz clic en el botón del icono de lápiz . Para obtener más información, consulta la sección sobre cómo desactivar el acceso público.

Para ofrecer una protección básica, la aplicación web requiere que se añada una clave secreta a la URL para enviar la petición. Puedes encontrar la clave secreta en la columna Clave secreta. Si abres la aplicación web desde Vertex AI Studio, la clave se añadirá a la URL automáticamente.

Abre la aplicación web y envía la petición.

En el cuadro de diálogo Gestionar aplicación web, haz clic en Abrir para acceder a la aplicación desplegada. La aplicación debe abrirse con la clave secreta añadida a la URL en el formato ?key=SECRET_KEY.

Abre la aplicación web desde el cuadro de diálogo de gestión de aplicaciones. La clave secreta se añade a la URL.

Introduce un valor en la variable y haz clic en Enviar. Deberías ver los resultados a la derecha.

Enviar la petición desde la aplicación web

Abrir la aplicación web desde el menú del botón Crear con código

Si tu aplicación web está lista, también puedes abrirla desde el menú del botón Compilar con código.

Abrir la aplicación desde el menú del botón Crear con código

Cloud Run es un servicio sin servidor, lo que significa que el contenedor de la aplicación se cerrará si no se usa de forma activa. Por lo tanto, la aplicación web puede tardar unos segundos en cargarse o no funcionar si la has dejado inactiva durante demasiado tiempo. Actualizar la página debería solucionar el problema.

Monitorizar el estado desde la campana de notificaciones

También puedes monitorizar el estado desde el menú Notificaciones haciendo clic en el icono de la campana. El icono de campana dejará de mostrar la animación de carga y mostrará un círculo verde si la implementación se ha completado correctamente.

Monitorizar el estado desde la campana de notificaciones

Si haces clic en la notificación, se te redirigirá a la página de Cloud Run. La URL de la página de Cloud Run no tiene la clave secreta añadida. Deberá añadirlo manualmente con el formato ?key=SECRET_KEY.

El enlace de la aplicación en la página de Cloud Run no tiene la clave añadida

Actualiza y vuelve a implementar tu petición

Puedes editar aún más tu petición en Vertex AI Studio y convertirla en una conversación. A continuación, haz clic en el botón Crear con código y en Gestionar aplicación para abrir el cuadro de diálogo Gestionar aplicación web. Haz clic en Actualizar aplicación para volver a implementar tu aplicación web con la petición actualizada.

Aparecerá un cuadro de diálogo de confirmación. Te indica que, si vuelves a desplegar la aplicación web, perderás los cambios que hayas hecho en ella fuera de Vertex AI Studio (por ejemplo, en el editor de código fuente de Cloud Run). Haz clic en Confirmar para continuar.

Volverá a aparecer el cuadro de diálogo Gestionar aplicación web. El proceso es similar al de la implementación inicial. Puedes monitorizar el progreso de la misma forma que la primera implementación.

Una vez que se haya completado la actualización, podrás volver a abrir la aplicación web. Verás la interfaz de conversación con la variable de petición. Rellena el valor y escribe cualquier contenido no vacío para continuar la conversación.

La aplicación actualizada tiene una interfaz de usuario de chat

Insertar contenido multimodal

Puedes insertar entradas como imágenes, vídeos, audio y documentos en la interfaz de usuario de la conversación. Los datos de entrada admitidos dependen del modelo seleccionado para la petición. Consulta la documentación sobre la compatibilidad multimodal de cada modelo.

Para insertar un archivo, haz clic en el botón con el icono de clip en el cuadro de entrada de la conversación.

Insertar entradas multimodales

Podrás interactuar con el modelo mediante las entradas que proporciones.

Interactúa con el modelo mediante las entradas multimodales

Temas avanzados

Cuando te hayas familiarizado con el proceso de implementación, puedes plantearte las siguientes acciones.

Editar el código fuente en Cloud Run

Si quieres personalizar la aplicación web, puedes modificar el código fuente en Cloud Run. Abre la página del código fuente de Cloud Run desde el cuadro de diálogo Gestionar aplicación web haciendo clic en el botón Más, situado al final de la fila. Abrir el editor de código fuente desde el cuadro de diálogo de gestión de aplicaciones web

También puede ir a la página de seguridad desde la aplicación web haciendo clic en el enlace editor de código fuente.

En la página del código fuente de Cloud Run, haz clic en Editar fuente para iniciar el modo de edición. Cuando hayas terminado, haz clic en Guardar y volver a implementar.

Una vez completado el nuevo despliegue, debes abrir la aplicación desde Vertex AI Studio. Puedes ir a la página de Vertex AI Studio desde el enlace de la insignia Desplegado desde Vertex AI.

Conceder acceso

Para dar acceso a la aplicación a usuarios o grupos, sigue estos pasos:

  1. Abre el cuadro de diálogo Gestionar aplicación web.
  2. En la columna Control de acceso, haga clic en el icono del lápiz . La página de seguridad de Cloud Run se abre en una pestaña nueva.
  3. En la página de seguridad de Cloud Run, busca la casilla de Identity-Aware Proxy (IAP). Asegúrate de que esté marcada y, a continuación, haz clic en Editar política.
  4. Aparecerá una subtarea que te permitirá editar el acceso. Introduce las direcciones de correo de los usuarios o grupos en el campo Principal. Si eres usuario de una organización, solo puedes añadir usuarios de la misma organización.
    Subtarea para editar la compra en la aplicación
  5. Deja el campo de niveles de acceso vacío.
  6. Haz clic en Guardar.
  7. Una vez que se haya cerrado la subtarea, vuelve a hacer clic en Guardar en la página de Cloud Run.
    Guardar de nuevo en la interfaz de Cloud Run

Desactivar el acceso público

Si no necesitas que la aplicación web sea accesible públicamente, puedes desactivarla en Cloud Run. Abre el cuadro de diálogo Gestionar aplicación web y haz clic en el icono de lápiz de la columna Control de acceso. La página de seguridad de Cloud Run se abrirá en una pestaña nueva.

También puedes ir a la página de seguridad desde la aplicación web haciendo clic en el enlace Configuración de seguridad.

En la página Seguridad del servicio de Cloud Run correspondiente a tu aplicación web, marca la opción Usar Cloud IAM para autenticar las solicitudes entrantes y elige Requerir autenticación. Haz clic en Guardar.

Como resultado, ya no se podrá acceder a tu aplicación web a través de la URL. Si intentas acceder a ella, verás una página con el mensaje Error: Forbidden (Error: prohibido).

Volver a activar el acceso público

Si quieres volver a activar el acceso público, desmarca la casilla Usar Cloud IAM para autenticar las solicitudes entrantes y guarda los cambios. Si eliges la opción Permitir invocaciones no autenticadas, no funcionará si tu proyecto está en una organización. Consulta más información sobre la autenticación en Cloud Run.

Configurar el acceso local para el desarrollo

En la Vista Previa Pública, aún no se admite el control de acceso. Por lo tanto, una vez que desactives el acceso público, la única forma de acceder a la aplicación web será configurando un proxy local. Puedes hacerlo con comandos de gcloud. Primero, abre Cloud Shell con el botón icono de terminal Google Cloud , situado en la esquina superior derecha de la consola. Se te pedirá que autorices Cloud Shell. Haz clic en Autorizar para continuar.

Cuando haya terminado, abre el cuadro de diálogo Gestionar aplicación web y haz clic en el botón más, situado al final de la fila, para ver más acciones. Haz clic en Configurar acceso local mediante Cloud Shell. Configurar el comando de acceso local desde el cuadro de diálogo de gestión de la aplicación web

Se añadirá un comando a tu Cloud Shell. Pulsa Intro y espera a que termine de imprimir. Haz clic en el enlace de la línea que empieza por Click on the link to preview. Podrás ver tu solicitud. Este enlace solo funciona cuando se está ejecutando el comando gcloud. Enlace de acceso local en Cloud Shell

Problemas más comunes

Error de autenticación: no hay clave secreta

Si aparece el siguiente error, significa que no se ha añadido ninguna clave secreta a la URL. Sigue las instrucciones para abrir la aplicación web desde Vertex AI Studio o copia la clave secreta del cuadro de diálogo Gestionar aplicación y añádela a la URL con el formato ?key=SECRET_KEY.

Error por falta de clave secreta

Error de autenticación: clave secreta no válida

El siguiente error significa que la clave añadida a la URL no es válida. La clave secreta es única para cada petición. Si tienes una clave secreta de otra petición, no funcionará. Sigue las instrucciones para abrir la aplicación web correctamente.

error por clave no válida

400 Invalid argument: empty input (400: argumento no válido: entrada vacía)

El siguiente error se produce cuando hay entradas en la variable de la petición, pero el chat está vacío. Aparecerá un mensaje de error 400. Para solucionarlo, escribe cualquier texto y vuelve a enviar la información.

error de contenido vacío

400 Argumento no válido: no se admite mimeType

Si elige un tipo de archivo que no admite el modelo, se devolverá un error 400. Esto es normal, y tendrás que usar otros tipos de archivos compatibles con el modelo. Consulta la documentación sobre la compatibilidad multimodal de cada modelo.

error para tipos MIME no admitidos

Pasos siguientes