Vertex AI 是一个机器学习 (ML) 平台,可让您训练、调优和部署机器学习模型和人工智能应用。如需向现有 Cloud Run 服务添加生成式 AI 功能,您可以使用 Vertex AI 访问生成式 AI 模型,例如 Gemini、PaLM、Imagen、Codey 等。
本指南介绍了如何使用 Cloud Run 集成为 Cloud Run 服务快速设置对 Vertex AI 的访问权限。
准备工作
- 确保您要集成的 Cloud Run 服务已部署完毕。
- 查看 Vertex AI 价格页面。您需要为集成中使用的各个资源付费。
所需的角色
如需使用 Cloud Run 集成,您或您的管理员必须向两个不同的主账号授予 IAM 角色。
点击查看您的 Google 账号需要的角色
如需获得使用 Cloud Run 集成所需的权限,请让您的管理员向您的 Google 账号授予项目的以下 IAM 角色:
- Cloud Run Developer (
roles/run.developer
) - Compute Viewer (
roles/compute.viewer
) - Serverless Integrations Developer (
roles/runapps.developer
) - Serverless Integrations Operator (
roles/runapps.operator
) - Service Account User (
roles/iam.serviceAccountUser
)
点击查看服务账号需要的角色
如需部署 Cloud Run 服务,您可以使用系统自动创建的 Compute Engine 默认服务账号,也可以指定用户管理的服务账号。服务账号必须具有以下角色:
- Cloud Run Developer (
roles/run.developer
) - Logs Bucket Writer (
roles/logging.bucketWriter
) - Service Account User (
roles/iam.serviceAccountUser
) - Storage Admin (
roles/storage.admin
) - Project IAM Admin (
roles/project.iamAdmin
)
将服务连接到 Vertex AI
当您使用 Cloud Run 集成连接到 Vertex AI 时,集成会执行以下操作:
- 为 Cloud Run 服务启用 Vertex AI API,以访问 Vertex AI 生成式 AI 模型。
- 为服务身份授予所需的角色。
您可以使用控制台或命令行创建集成。
控制台
在 Google Cloud 控制台中,转到 Cloud Run 页面。
在服务列表中,点击要在此集成中使用的服务。
点击 Integrations(集成)标签。
点击添加集成。
点击 Vertex AI。
使用默认名称,或者将名称更改为您要使用的值。
如果系统提示您启用 API 列表,请点击启用并等待 API 启用。
点击提交,然后等待集成完成。此过程最多可能需要一分钟。
gcloud
更新到最新的 Google Cloud CLI:
gcloud components update
创建集成:
gcloud beta run integrations create \ --type=vertex-genai \ --service=SERVICE \
您需要进行如下替换:
- 将 SERVICE 替换为您的 Cloud Run 服务的名称。
(可选)添加
--service-account=SERVICE_ACCOUNT_EMAIL
标志。将 SERVICE_ACCOUNT_EMAIL 替换为用于部署服务的用户管理的服务账号电子邮件地址 (
PROJECT_NUMBER-compute@developer.gserviceaccount.com
)。如果要使用默认计算服务账号 (SERVICE_ACCOUNT_ID@PROJECT_ID.iam.gserviceaccount.com
),请省略此标志。如需在部署 Cloud Run 集成时继续使用指定的服务账号,请运行以下命令:
gcloud config set runapps/deployment-service-account
等待一分钟,在此期间,系统会向 Cloud Run 服务授予调用 Vertex AI API 的权限。
[vertex-genai] integration [vertex-genai-xxx] has been created successfully.
您可以使用
gcloud beta run integrations describe
来查看状态。
查看 Vertex AI 集成
如需查看 Cloud Run 服务的 Vertex AI 集成的当前状态,请执行以下操作:
控制台
在 Google Cloud 控制台中,转到 Cloud Run 页面。
在服务列表中,点击要在此集成中使用的服务。
点击 Integrations(集成)标签。
找到相关 Vertex AI 集成,然后点击查看详情。
gcloud
使用以下命令获取可用集成的列表:
gcloud beta run integrations list
使用返回列表中的名称显示它的详细信息:
gcloud beta run integrations describe INTEGRATION_NAME
将 INTEGRATION_NAME 替换为您的 Vertex AI 集成的名称。
删除 Vertex AI 集成
如果删除集成,则系统还会删除与该集成关联的所有 Google Cloud 资源,但不会删除 Cloud Run 服务。
如需从 Cloud Run 服务中删除 Vertex AI 集成,请执行以下操作:
控制台
在 Google Cloud 控制台中,转到 Cloud Run 页面。
点击要删除集成的服务。
点击 Integrations(集成)标签。
找到您感兴趣的 Vertex AI 集成,点击集成右侧的省略号图标,然后点击删除。
gcloud
使用以下命令获取可用集成的列表:
gcloud beta run integrations list
使用返回列表中的名称删除集成:
gcloud beta run integrations delete INTEGRATION_NAME
您需要进行如下替换:
- 将 INTEGRATION_NAME 替换为您的 Vertex AI 集成的名称。
(可选)您可以使用以下标志选项:
选项 说明 --service-account
用于执行删除操作的用户管理的服务账号电子邮件地址。
在代码中访问 Vertex AI 生成式 AI 模型
完成集成后,您可以在应用中向 Vertex AI 模型 API 发送请求并使用 Vertex AI Studio 快速测试和自定义生成式 AI 模型。
限制
Cloud Run 集成仅在某些区域受支持。如果您需要使用 Cloud Run 集成不支持的区域,请参阅 Vertex AI 位置。