预配 GPU 并启用 Vertex AI 预训练 API

每项 Vertex AI 服务都需要不同的计算资源,包括图形处理器 (GPU),如容量规划和计算要求中所述。 本页介绍了如何预配 GPU 资源,以便在 GPU 环境中运行人工智能 (AI) 和机器学习 (ML) 工作负载。本页面还逐步介绍了如何在 Google Distributed Cloud (GDC) 气隙设备上启用 Vertex AI 预训练 API,以便您可以开始实现 Vertex AI 功能。

大多数配置 GPU 资源以及启用或停用 Vertex AI 预训练 API 的任务都需要管理员访问权限。如果您缺少必要的权限,请让管理员代表您启用 GPU 和 Vertex AI 预训练 API。

GDC 气隙设备上的 Vertex AI 包含三个 API,分别对应于其预训练模型。如需详细了解这些预训练模型,请参阅以下文档:

使用 GDC 控制台启用、停用和查看 Vertex AI 预训练 API 的端点。

准备工作

如需获得启用预训练 API 所需的权限,请让您的组织 IAM 管理员或项目 IAM 管理员在项目命名空间中向您授予 AI Platform Admin (ai-platform-admin) 角色。

如需了解此角色,请参阅准备 IAM 权限。 如需了解如何向正文授予权限,请参阅授予和撤消访问权限

请按照以下步骤在启用预训练的 API 之前预配 GPU:

  1. 设置项目以使用 Vertex AI
  2. 确保您的项目已配置足够的入站通信。
  3. 管理 GPU 工作负载
  4. 登录 GDC 控制台。 如果您无法登录,请参阅在身份提供方不可用的情况下恢复设备

启用预训练的 API

您可以使用 GDC 控制台启用 OCR、Speech-to-Text 和 Vertex AI Translation 预训练 API。

满足前提条件后,请按以下步骤启用预训练的 API:

  1. 登录 GDC 控制台
  2. 在导航菜单中,依次点击 Vertex AI > 预训练 API
  3. 预训练 API 页面上,点击特定服务上的启用以启用相应 API。

  4. 在确认对话框中,点击启用。系统会显示一条进度消息。

启用时长各不相同。此过程可能需要 15 到 45 分钟才能完成。

如果您想查看预训练 API 的状态,请查看服务状态和端点

停用预先训练的 API

您可以使用 GDC 控制台停用 OCR、Speech-to-Text 和 Vertex AI Translation 预训练 API。

满足前提条件后,请按以下步骤停用预训练的 API:

  1. 登录 GDC 控制台
  2. 在导航菜单中,依次点击 Vertex AI > 预训练 API
  3. 预训练 API 页面上,点击特定服务上的停用以停用相应 API。

  4. 在确认对话框中,在文本字段中输入 disable,以确认您要执行相应操作。然后,点击停用。系统会显示进度消息。

如果您想查看预训练 API 的状态,请查看服务状态和端点