Vertex AI es una plataforma de aprendizaje automático (AA) que te permite entrenar, ajustar e implementar modelos de AA y aplicaciones de IA. Para agregar capacidades de IA generativa a un servicio existente de Cloud Run, puedes usar Vertex AI para acceder a modelos de IA generativas, como Gemini, PaLM, Imagen, Codey y muchos más.
En esta guía, se explica cómo usar las integraciones de Cloud Run a fin de configurar con rapidez el acceso a Vertex AI para tu servicio de Cloud Run.
Antes de comenzar
- Asegúrate de que el servicio de Cloud Run con el que te integras ya esté implementado.
- Revisa la página de precios de Vertex AI. Se te facturan los recursos individuales usados en la integración.
Roles obligatorios
Para usar las integraciones de Cloud Run, tú o tu administrador deben otorgar roles de IAM en dos principales diferentes.
Haz clic para ver los roles necesarios para tu Cuenta de Google
Para obtener los permisos que necesitas para usar las integraciones de Cloud Run, pídele a tu administrador que otorgue a tu Cuenta de Google los siguientes roles de IAM en tu proyecto:
- Desarrollador de Cloud Run (
roles/run.developer
) - Visualizador de Compute (
roles/compute.viewer
) - Desarrollador de Serverless Integrations (
roles/runapps.developer
) - Operador de Serverless Integrations (
roles/runapps.operator
) - Usuario de cuenta de servicio (
roles/iam.serviceAccountUser
)
Haz clic para ver los roles necesarios para la cuenta de servicio
Para implementar el servicio de Cloud Run, puedes usar la cuenta de servicio predeterminada de Compute Engine creada automáticamente o especificar una cuenta de servicio administrada por el usuario. Esta cuenta de servicio debe tener los siguientes roles:
- Desarrollador de Cloud Run (
roles/run.developer
) - Escritor de bucket de servicios (
roles/logging.bucketWriter
) - Usuario de cuenta de servicio (
roles/iam.serviceAccountUser
) - Administrador de almacenamiento (
roles/storage.admin
) - Administrador de IAM de proyecto (
roles/project.iamAdmin
)
Conecta un servicio a Vertex AI
Cuando usas integraciones de Cloud Run para conectarte a Vertex AI, la integración hace lo siguiente:
- Habilita la API de Vertex AI para que el servicio de Cloud Run acceda a los modelos de IA generativa de Vertex AI.
- Otorga a la identidad del servicio los roles necesarios.
Puedes crear la integración mediante la consola o la línea de comandos.
Console
En la consola de Google Cloud, ve a la página Cloud Run.
Haz clic en el servicio de la lista de servicios que deseas usar en esta integración.
Haz clic en la pestaña Integraciones.
Haz clic en Agregar integración.
Haz clic en Vertex AI.
Usa el nombre predeterminado o cambia el nombre por el valor que quieres usar.
Si se te solicita que habilites una lista de APIs, haz clic en Habilitar y espera a que las API se habiliten.
Haz clic en Enviar y espera a que se complete la integración. Esto puede tardar hasta un minuto.
gcloud
Actualiza a la versión más reciente de Google Cloud CLI:
gcloud components update
Crea la integración:
gcloud beta run integrations create \ --type=vertex-genai \ --service=SERVICE \
Reemplaza lo siguiente:
- SERVICE por el nombre de servicio de Cloud Run
De manera opcional, puedes incluir la marca
--service-account=SERVICE_ACCOUNT_EMAIL
.Reemplaza SERVICE_ACCOUNT_EMAIL por la dirección de correo electrónico de la cuenta de servicio administrada por el usuario (
PROJECT_NUMBER-compute@developer.gserviceaccount.com
) que se usa para implementar el servicio. Omite esta marca si deseas usar la cuenta de servicio de procesamiento predeterminada (SERVICE_ACCOUNT_ID@PROJECT_ID.iam.gserviceaccount.com
).Para seguir usando la cuenta de servicio especificada cuando implementas integraciones de Cloud Run, ejecuta lo siguiente:
gcloud config set runapps/deployment-service-account
Espera hasta un minuto, durante el cual tu servicio de Cloud Run recibe permisos para llamar a la API de Vertex AI.
[vertex-genai] integration [vertex-genai-xxx] has been created successfully.
Puedes verificar el estado con
gcloud beta run integrations describe
.
Ver integraciones de Vertex AI
Para ver el estado actual de las integraciones de Vertex AI para el servicio de Cloud Run, sigue estos pasos:
Console
En la consola de Google Cloud, ve a la página Cloud Run.
Haz clic en el servicio de la lista de servicios que deseas usar en esta integración.
Haz clic en la pestaña Integraciones.
Ubica la integración de Vertex AI que te interese y haz clic en Ver detalles.
gcloud
Usa el siguiente comando para obtener una lista de las integraciones disponibles:
gcloud beta run integrations list
Con un nombre de la lista que se muestra, muestra sus detalles:
gcloud beta run integrations describe INTEGRATION_NAME
Reemplaza INTEGRATION_NAME por el nombre de tu integración de Vertex AI.
Borra integraciones de Vertex AI
Si borras una integración, también se borrarán todos los recursos de Google Cloud asociados a esa integración, pero no se borrará tu servicio de Cloud Run.
Para borrar una integración de Vertex AI de tu servicio de Cloud Run, sigue estos pasos:
Console
En la consola de Google Cloud, ve a la página Cloud Run.
Haz clic en el servicio del que deseas borrar una integración.
Haz clic en la pestaña Integraciones.
Ubica la integración de Vertex AI que te interese y haz clic en el ícono de puntos suspensivos a la derecha de la integración. Luego, haz clic en Borrar.
gcloud
Usa el siguiente comando para obtener una lista de las integraciones disponibles:
gcloud beta run integrations list
Con un nombre de la lista que se muestra, borra la integración:
gcloud beta run integrations delete INTEGRATION_NAME
Reemplaza lo siguiente:
- INTEGRATION_NAME por el nombre de tu integración de Vertex AI.
De manera opcional, puedes usar las siguientes opciones de marcas:
Opción Descripción --service-account
La dirección de correo electrónico de la cuenta de servicio administrada por el usuario para realizar la operación de eliminación.
Accede a modelos de IA generativa de Vertex AI en tu código
Después de completar la integración, puedes enviar solicitudes a las APIs de modelo de Vertex AI y usar Vertex AI Studio para probar y personalizar con rapidez los modelos de IA generativa en tu aplicación.
Limitaciones
Las integraciones de Cloud Run solo se admiten en ciertas regiones. Si necesitas usar una región que no sea compatible con las integraciones de Cloud Run, consulta Ubicaciones de Vertex AI.