借助 Vertex AI - 预测任务,您可以执行在线预测。在线预测是指向模型端点发出同步请求。您可以在发出请求以响应应用输入或需要及时推断时使用在线预测。
Vertex AI 是一项 Google Cloud 服务,可让您训练和部署机器学习模型和 AI 应用,以及自定义大语言模型 (LLM),以便在依托 AI 技术的应用中使用。
须知事项
在配置 Vertex AI - 预测任务之前,请确保在您的 Google Cloud 项目中执行以下任务:
- 启用 Vertex AI API (
aiplatform.googleapis.com
)。 - 将model资源部署到端点。
- 创建身份验证配置文件。Apigee Integration 会使用身份验证配置文件连接到身份验证端点以完成Vertex AI - 预测任务。
- 确保未在 Google Cloud 项目中为 Apigee Integration 设置 VPC Service Controls。
配置“Vertex AI - 预测”任务
- 在 Apigee 界面中,选择您的 Apigee 组织。
- 点击开发 > 集成。
- 选择现有集成,或通过点击创建集成来创建新集成。
要创建新的集成,请执行以下操作:
- 在创建 Integrations对话框中输入名称和说明。
- 从支持的区域列表中选择集成的区域。
- 点击创建。
这将在集成设计器中打开集成。
- 在集成设计器导航栏中,点击 + 添加任务/触发器 > 任务以查看可用任务列表。
- 点击 Vertex AI - 预测元素并将其放入集成设计器中。
- 点击设计器上的 Vertex AI - 预测元素以查看 Vertex AI - 预测任务配置窗格。
- 前往身份验证,然后选择您要使用的现有身份验证配置文件。
可选。如果您在配置此任务之前未创建身份验证配置文件,请点击 + New authentication profile(+ 新建身份验证配置文件),然后按照创建新的身份验证配置文件中所述的步骤操作。
- 前往 Task Input(任务输入),然后使用以下任务输入参数表配置显示的输入字段。
系统会自动保存对输入字段的更改。
任务输入参数
下表介绍了 Vertex AI - 预测任务的输入参数:
属性 | 数据类型 | 说明 |
---|---|---|
区域 | 字符串 | 模型端点位置。例如:us - 美国。 |
ProjectsId | 字符串 | 您的 Google Cloud 项目 ID。 |
端点 | 字符串 | 被请求执行预测的端点的名称。 |
请求 | JSON | 请参阅请求 JSON 结构。 |
任务输出
Vertex AI - 预测任务返回包含预测结果的响应。
错误处理策略
任务的错误处理策略指定当任务因暂时性错误而失败时要执行的操作。如需了解如何使用错误处理策略,以及了解不同类型的错误处理策略,请参阅错误处理策略。
后续步骤
- 添加边缘和边缘条件。
- 测试并发布您的集成。
- 配置触发器。
- 添加数据映射任务。
- 查看 Google Cloud 服务的所有任务。