连接到 Vertex AI 生成式 AI 模型

Vertex AI 是一个机器学习 (ML) 平台,可让您训练、调优和部署机器学习模型和人工智能应用。如需向现有 Cloud Run 服务添加生成式 AI 功能,您可以使用 Vertex AI 访问生成式 AI 模型,例如 Gemini、PaLM、Imagen、Codey 等。

本指南介绍了如何使用 Cloud Run 集成为 Cloud Run 服务快速设置对 Vertex AI 的访问权限。

准备工作

  • 确保您要集成的 Cloud Run 服务已部署完毕。
  • 查看 Vertex AI 价格页面。您需要为集成中使用的各个资源付费。

所需的角色

如需使用 Cloud Run 集成,您或您的管理员必须向两个不同的主账号授予 IAM 角色

点击查看您的 Google 账号需要的角色

如需获得使用 Cloud Run 集成所需的权限,请让您的管理员向您的 Google 账号授予项目的以下 IAM 角色:

点击查看服务账号需要的角色

如需部署 Cloud Run 服务,您可以使用系统自动创建的 Compute Engine 默认服务账号,也可以指定用户管理的服务账号。服务账号必须具有以下角色:

将服务连接到 Vertex AI

当您使用 Cloud Run 集成连接到 Vertex AI 时,集成会执行以下操作:

  • 为 Cloud Run 服务启用 Vertex AI API,以访问 Vertex AI 生成式 AI 模型。
  • 为服务身份授予所需的角色。

您可以使用控制台或命令行创建集成。

控制台

  1. 在 Google Cloud 控制台中,转到 Cloud Run 页面。

    转到 Cloud Run

  2. 在服务列表中,点击要在此集成中使用的服务。

  3. 点击 Integrations(集成)标签。

  4. 点击添加集成

  5. 点击 Vertex AI

  6. 使用默认名称,或者将名称更改为您要使用的值。

  7. 如果系统提示您启用 API 列表,请点击启用并等待 API 启用。

  8. 点击提交,然后等待集成完成。此过程最多可能需要一分钟。

gcloud

  1. 更新到最新的 Google Cloud CLI:

    gcloud components update
  2. 创建集成:

    gcloud beta run integrations create \
    --type=vertex-genai \
    --service=SERVICE \

    您需要进行如下替换:

    • SERVICE 替换为您的 Cloud Run 服务的名称。

    (可选)添加 --service-account=SERVICE_ACCOUNT_EMAIL 标志。

    • SERVICE_ACCOUNT_EMAIL 替换为用于部署服务的用户管理的服务账号电子邮件地址 (PROJECT_NUMBER-compute@developer.gserviceaccount.com)。如果要使用默认计算服务账号 (SERVICE_ACCOUNT_ID@PROJECT_ID.iam.gserviceaccount.com),请省略此标志。

      如需在部署 Cloud Run 集成时继续使用指定的服务账号,请运行以下命令:

      gcloud config set runapps/deployment-service-account
  3. 等待一分钟,在此期间,系统会向 Cloud Run 服务授予调用 Vertex AI API 的权限。

    [vertex-genai] integration [vertex-genai-xxx] has been created successfully.

    您可以使用 gcloud beta run integrations describe 来查看状态。

查看 Vertex AI 集成

如需查看 Cloud Run 服务的 Vertex AI 集成的当前状态,请执行以下操作:

控制台

  1. 在 Google Cloud 控制台中,转到 Cloud Run 页面。

    转到 Cloud Run

  2. 在服务列表中,点击要在此集成中使用的服务。

  3. 点击 Integrations(集成)标签。

  4. 找到相关 Vertex AI 集成,然后点击查看详情

gcloud

  1. 使用以下命令获取可用集成的列表:

    gcloud beta run integrations list
  2. 使用返回列表中的名称显示它的详细信息:

    gcloud beta run integrations describe INTEGRATION_NAME

    INTEGRATION_NAME 替换为您的 Vertex AI 集成的名称。

删除 Vertex AI 集成

如果删除集成,则系统还会删除与该集成关联的所有 Google Cloud 资源,但不会删除 Cloud Run 服务。

如需从 Cloud Run 服务中删除 Vertex AI 集成,请执行以下操作:

控制台

  1. 在 Google Cloud 控制台中,转到 Cloud Run 页面。

    转到 Cloud Run

  2. 点击要删除集成的服务。

  3. 点击 Integrations(集成)标签。

  4. 找到您感兴趣的 Vertex AI 集成,点击集成右侧的省略号图标,然后点击删除

gcloud

  1. 使用以下命令获取可用集成的列表:

    gcloud beta run integrations list
  2. 使用返回列表中的名称删除集成:

    gcloud beta run integrations delete INTEGRATION_NAME

    您需要进行如下替换:

    • INTEGRATION_NAME 替换为您的 Vertex AI 集成的名称。

    (可选)您可以使用以下标志选项:

    选项 说明
    --service-account 用于执行删除操作的用户管理的服务账号电子邮件地址。

在代码中访问 Vertex AI 生成式 AI 模型

完成集成后,您可以在应用中向 Vertex AI 模型 API 发送请求并使用 Vertex AI Studio 快速测试和自定义生成式 AI 模型。

限制

Cloud Run 集成仅在某些区域受支持。如果您需要使用 Cloud Run 集成不支持的区域,请参阅 Vertex AI 位置