Guía de inicio rápido: Implementa tu instrucción de Vertex AI Studio como una aplicación web

En Vertex AI Studio, puedes diseñar tus instrucciones y realizar iteraciones en ellas, y comparar los resultados de diferentes configuraciones y modelos. Una vez que termines de diseñar tu instrucción, puedes implementarla como una aplicación web para compartirla con tus colaboradores o usuarios objetivo y permitirles probarla. La aplicación web se aloja en Cloud Run y está disponible fuera de la consola de Google Cloud .

En esta guía de inicio rápido, harás lo siguiente:

  • Crea una instrucción con variables de instrucción
  • Implementa tu instrucción como una aplicación web
  • Supervisa el progreso de la implementación y prueba la aplicación implementada
  • Actualiza y vuelve a implementar tu instrucción
  • Prueba el envío de instrucciones con compatibilidad multimodal

Antes de comenzar

Si nunca usaste Vertex AI Studio, puedes seguir otra guía de inicio rápido o tomar el curso de Google Cloud Skills Boost para aprender los conceptos básicos de Vertex AI Studio. En esta guía, debes tener lo siguiente:

  1. Un proyecto de Google Cloud creado con la facturación habilitada
  2. API de Vertex AI habilitada

Se requieren permisos adicionales

Además de los permisos existentes para usar Vertex AI Studio, para implementar tu instrucción, debes tener los siguientes permisos:

Acción Permisos necesarios Objetivo
Habilitar APIs adicionales serviceusage.services.enable Habilita las siguientes APIs:
  • API de Cloud Run Admin (run.googleapis.com)
  • API de Identity-Aware Proxy (iap.googleapis.com)
  • API de Artifact Registry (artifactregistry.googleapis.com)
  • API de Cloud Build (cloudbuild.googleapis.com)
  • API de Cloud Logging (logging.googleapis.com)
Otorga permisos a las cuentas de servicio resourcemanager.projects.setIamPolicy Otorga los siguientes roles a la cuenta de servicio predeterminada de Compute Engine:
Implementa permisos específicos
  • storage.buckets.create
  • run.services.create
  • artifactregistry.repositories.create
  • run.services.setIamPolicy
Durante la implementación, se subirá un conjunto de códigos fuente a Cloud Storage y, luego, se implementará en Cloud Run con un servicio nuevo creado. Se requiere artifactregistry.repositories.create para crear un repositorio para la imagen de contenedor. El run.services.setIamPolicy es obligatorio para que el servicio sea de acceso público.

Si eres propietario de tu proyecto, no necesitas realizar acciones adicionales, sino que debes seguir las guías de Vertex AI Studio. Si no eres el propietario de tu proyecto, pídele al administrador del proyecto que realice las dos primeras acciones y, luego, que te otorgue los roles de Editor (roles/editor) y Administrador de Cloud Run (roles/run.admin).

Crea una instrucción con variables de instrucción

Navega a la página de creación de instrucciones de Vertex AI Studio y, luego, haz clic en Agregar variable en el cuadro de entrada de instrucciones.

En el diálogo Administrar variables de instrucción, ingresa un nombre de variable y asígnale un valor. Luego, haz clic en Aplicar.

Diálogo Administrar variables de instrucción

En el cuadro de entrada de la instrucción, redacta la instrucción con la variable y, luego, ajusta otros parámetros. Por ejemplo, puedes habilitar Fundamentación con la Búsqueda de Google y tener "Siempre obtén el clima actual de la Web" como instrucciones del sistema.

Implementa tu instrucción como una aplicación web

Para implementar tu instrucción como una aplicación web, haz clic en el botón Compilar con código en la esquina superior derecha. Luego, haz clic en Implementar como app.

Haz clic en el botón Build with code y, luego, en Deploy as app.

Guarda la instrucción

Aparecerá el diálogo de guardar la instrucción, ya que es necesario guardar una instrucción antes de que se pueda implementar. El diálogo de implementación se abrirá automáticamente una vez que se guarde la instrucción.

Guarda la instrucción antes de la implementación

Habilita las APIs para la primera implementación y otorga permisos

  1. Una vez que se guarde la instrucción, continuará el proceso de implementación. Si es la primera vez que realizas una implementación, verás un diálogo para habilitar las APIs requeridas. Haz clic en Habilita las APIs requeridas.
  2. Después de habilitar las APIs, aparecerá el diálogo Create a web app. Puedes elegir Autenticación obligatoria (a través de Identity-Aware Proxy) o Permitir acceso público.
    • Si se elige la autenticación obligatoria, sigue la guía para otorgar acceso (inclúyete).
    • Cuando se elige permitir el acceso público, significa que cualquier persona puede acceder a la app. Por lo tanto, no incluyas información sensible ni información de identificación personal (PII) en tu instrucción. Marca la casilla de verificación Entiendo que esta app se implementará de forma pública para confirmar.
  3. Haz clic en Crear app para iniciar la implementación.
  4. Si esta es tu primera implementación, aparecerá otro diálogo en el que se te pedirá que otorgues los roles necesarios a la cuenta de servicio. Haz clic en Otorgar todo para continuar.

Si esta es tu primera implementación, aparecerá otro diálogo en el que se te pedirá que otorgues los roles necesarios a la cuenta de servicio. Haz clic en Otorgar todo para continuar.

Comienza la Deployment

Vertex AI Studio creará un archivo ZIP que contendrá el código fuente de la aplicación web y lo subirá a un bucket de Cloud Storage. Una vez que comience la implementación, aparecerá el diálogo Administrar app web con información sobre tu implementación, como el nombre de la aplicación, la fecha de la última implementación, el estado de la implementación y mucho más.

Diálogo de administración de la app

Supervisa el estado de la implementación

Deployment tarda entre 2 y 3 minutos en completarse, y el estado de la implementación se muestra en la columna Estado del diálogo Administrar app web. Si cierras el diálogo Administrar app web, puedes volver a abrirlo desde el menú que se encuentra debajo del botón Compilar con código.

Una vez que se complete la implementación, la columna de estado cambiará a Listo y aparecerá el botón Abrir junto al nombre de la aplicación.

El botón para abrir la app aparece junto al nombre de la app.

Control de acceso y clave secreta

Tu aplicación web se implementa con el control de acceso Permitir sin autenticar habilitado de forma predeterminada. Para desactivarlo, haz clic en el botón del ícono de lápiz . Consulta la sección para desactivar el acceso público para obtener más información.

Para brindar protección básica, la aplicación web requiere que se agregue una clave secreta a la URL para enviar la instrucción. Puedes encontrar la clave secreta en la columna Clave secreta. Si abres la aplicación web desde Vertex AI Studio, la clave se agregará a la URL automáticamente.

Abre la aplicación web y envía la instrucción

Haz clic en Abrir en el cuadro de diálogo Administrar app web para acceder a la aplicación implementada. La aplicación se debe abrir con la clave secreta agregada a la URL en el formato ?key=SECRET_KEY.

Abre la aplicación web desde el diálogo de administración de la aplicación. La clave secreta se adjunta a la URL.

Ingresa un valor para la variable y, luego, haz clic en Enviar. Deberías poder ver los resultados a la derecha.

Envía la instrucción desde la app web

Abre la aplicación web desde el menú del botón Compilar con código.

Si tu aplicación web está lista, también puedes abrirla desde el menú del botón Compilar con código.

Abre la app desde el menú del botón Compilar con código.

Cloud Run es un servicio sin servidores, lo que significa que el contenedor de la aplicación se cerrará si no se usa de forma activa. Por lo tanto, a veces, la aplicación web puede tardar unos segundos en cargarse, o bien un envío no funcionará si dejaste la aplicación web inactiva durante demasiado tiempo. Actualizar la página debería resolver el problema.

Cómo supervisar el estado desde la campana de notificaciones

También puedes supervisar el estado desde el menú Notificaciones haciendo clic en el ícono de campana. El ícono de campana detendrá su animación de carga y mostrará un círculo verde si la implementación se completó correctamente.

Supervisa el estado desde la campana de notificaciones

Si haces clic en la notificación, se te redireccionará a la página de Cloud Run. La URL en la página de Cloud Run no tiene la clave secreta agregada. Deberás agregarla manualmente en el formato ?key=SECRET_KEY.

El vínculo de la app en la página de Cloud Run no tiene la clave agregada.

Actualiza y vuelve a implementar tu instrucción

Puedes editar aún más tu instrucción en Vertex AI Studio y convertirla en una conversación. Luego, haz clic en el botón Compilar con código y, luego, en Administrar app para abrir el diálogo Administrar app web. Haz clic en Actualizar app para volver a implementar tu aplicación web con la instrucción actualizada.

Aparecerá un cuadro de diálogo de confirmación. Te indica que, si vuelves a implementar, perderás los cambios que hayas realizado en la aplicación web implementada fuera de Vertex AI Studio (por ejemplo, en el editor de código fuente de Cloud Run). Haz clic en Confirmar para continuar.

Volverá a aparecer el diálogo Administrar app web. El proceso es similar al de la implementación inicial. Puedes supervisar el progreso de la misma manera que la primera implementación.

Una vez que se complete la actualización, podrás volver a abrir la aplicación web. Verás la IU de conversación con la variable de instrucción. Completa el valor y escribe cualquier contenido no vacío para continuar la conversación.

La app actualizada tiene una IU de chat

Inserta contenido multimodal

Puedes insertar entradas como imágenes, videos, audio y documentos en la IU de conversación. Las entradas admitidas dependen del modelo seleccionado para la instrucción. Consulta la documentación sobre la compatibilidad multimodal de cada modelo.

Para insertar un archivo, haz clic en el botón con el ícono de clip en el cuadro de entrada de la conversación.

Inserta entradas multimodales

Podrás interactuar con el modelo con la entrada que proporciones.

Interactúa con el modelo usando las entradas multimodales

Temas avanzados

Una vez que te familiarices con el proceso de implementación, puedes considerar las siguientes acciones.

Edita el código fuente en Cloud Run

Si deseas personalizar la aplicación web, puedes hacer cambios en el código fuente en Cloud Run. Abre la página del código fuente de Cloud Run desde el diálogo Administrar app web haciendo clic en el botón de ícono de más opciones al final de la fila. editor de código fuente abierto desde el diálogo de administración de la app web

También puedes navegar a la página de seguridad desde la aplicación web haciendo clic en el vínculo del editor de código fuente.

En la página del código fuente de Cloud Run, haz clic en Editar fuente para iniciar el modo de edición. Cuando termines, haz clic en Guardar y volver a implementar.

Una vez que se complete la reimplementación, deberás abrir la aplicación desde Vertex AI Studio. Puedes navegar a la página de Vertex AI Studio desde el vínculo en la insignia Implementado desde Vertex AI.

Otorgar acceso

Para otorgar acceso a la app a usuarios o grupos, sigue estos pasos:

  1. Abre el diálogo Administrar aplicación web.
  2. Haz clic en el ícono de lápiz en la columna Control de acceso. La página de seguridad de Cloud Run se abrirá en una pestaña nueva.
  3. En la página de seguridad de Cloud Run, busca la casilla de verificación de Identity-Aware Proxy (IAP). Asegúrate de que esté marcada y, luego, haz clic en Editar política.
  4. Aparecerá una subtarea que te permitirá editar el acceso. Ingresa los correos electrónicos de usuarios o grupos en el campo Principal. Si eres usuario de una organización, solo puedes agregar usuarios de la misma organización.
    Subtarea para editar la IAP
  5. Deja el campo de niveles de acceso vacío.
  6. Haz clic en Guardar.
  7. Después de cerrar la subtarea, vuelve a hacer clic en Guardar en la página de Cloud Run.
    Vuelve a guardar en la IU de Cloud Run

Desactiva el acceso público

Cuando no necesites que la aplicación web sea de acceso público, puedes desactivarla en Cloud Run. Abre el diálogo Administrar app web y haz clic en el ícono de lápiz en la columna Control de acceso. La página de seguridad de Cloud Run se abrirá en una pestaña nueva.

También puedes navegar a la página de seguridad desde la aplicación web haciendo clic en el vínculo Configuración de seguridad.

En la página Seguridad del servicio de Cloud Run correspondiente a tu aplicación web, marca la casilla de verificación Usar Cloud IAM para autenticar las solicitudes entrantes y elige Requerir autenticación. Haga clic en Guardar.

Esto hará que tu aplicación web deje de estar accesible a través de la URL. Si intentas acceder a ella, verás una página de Error: Forbidden.

Cómo volver a activar el acceso público

Si deseas volver a activar el acceso público, desmarca la casilla de verificación Usar Cloud IAM para autenticar las solicitudes entrantes y guarda los cambios. Si eliges la opción Permitir invocaciones no autenticadas, no funcionará si tu proyecto pertenece a una organización. Consulta Autenticación en Cloud Run para obtener más detalles.

Configura el acceso local para el desarrollo

En la versión preliminar pública, aún no se admite el control de acceso. Por lo tanto, una vez que desactives el acceso público, la única forma de acceder a la aplicación web será configurar un proxy local. Puedes hacerlo a través de los comandos de gcloud. Primero, abre Cloud Shell con el botón del ícono de terminal en la esquina superior derecha de la consola de Google Cloud . Se te solicitará que autorices Cloud Shell. Haz clic en Autorizar para continuar.

Cuando termines, abre el diálogo Administrar app web y haz clic en el botón de ícono de más al final de la fila para ver más acciones. Haz clic en Configurar el acceso local a través de Cloud Shell. Obtén el comando de configuración del acceso local desde el diálogo de administración de la app web

Se agregará un comando a tu instancia de Cloud Shell. Presiona Intro y espera a que termine de imprimir. Haz clic en el vínculo de la línea que comienza con Click on the link to preview. Podrás ver tu aplicación. Este vínculo solo funciona cuando se ejecuta el comando de gcloud. Vínculo de acceso local en Cloud Shell

Problemas comunes

Error de autenticación: No hay clave secreta

Si ves el siguiente error, significa que no se agregó ninguna clave secreta a la URL. Sigue las instrucciones para abrir la aplicación web desde Vertex AI Studio o copia la clave secreta del diálogo Administrar app y agrégala a la URL en el formato ?key=SECRET_KEY.

Error por falta de clave secreta

Error de autenticación: Clave secreta no válida

El siguiente error significa que la clave agregada a la URL no es válida. La clave secreta es única para cada instrucción. Si tienes una clave secreta de otra instrucción, no funcionará. Sigue las instrucciones para abrir la aplicación web correctamente.

Error por clave no válida

400, argumento no válido: entrada vacía

El siguiente error se produce cuando tienes entradas en la variable de instrucción, pero el chat está vacío. Aparecerá un mensaje de error 400. Para corregir este error, escribe cualquier texto no vacío y vuelve a enviar la solicitud.

Error por contenido vacío

400 Invalid argument: mimeType is not supported

Si eliges un tipo de archivo que el modelo no admite, se mostrará un error 400. Esto es normal, y tendrás que usar otros tipos de archivos compatibles con el modelo. Consulta la documentación sobre la compatibilidad multimodal de cada modelo.

Error para los tipos de MIME no admitidos

Próximos pasos