您可以使用代管式数据集提供用于在 Vertex AI 上训练 AutoML 和自定义模型的源数据。代管式数据集对于 AutoML 是必需的,对于自定义训练则是可选的。
权限和访问权限控制
当您使用 Cloud Storage 存储桶中的数据创建数据集时,Vertex AI 需要获得访问相应数据的权限。Vertex AI 使用一种特殊的 Google 托管式服务账号(称为服务代理)来安全地访问您的数据。如需详细了解所需角色以及服务代理的运作方式,请参阅使用 IAM 进行访问权限控制。
为 AutoML 模型创建代管式数据集
您可以使用Google Cloud 控制台或 Vertex AI API 创建托管式数据集,用于训练 AutoML 模型。有关如何执行此操作的说明会因数据类型和模型目标而略有不同。首先准备训练数据。
图片
了解如何为以下类型的图片 AutoML 模型创建代管式数据集:
表格
了解如何为以下类型的表格 AutoML 模型创建代管式数据集:
视频
了解如何为以下类型的视频 AutoML 模型创建代管式数据集:
为自定义训练模型创建代管式数据集
无论您的数据类型或模型目标是什么,有关如何创建用于训练自定义模型的代管式数据集的说明都是相同的。
如需了解详情,请参阅使用代管式数据集。
使用 Data Catalog 查看托管式数据集
Data Catalog 是一项可伸缩的全托管式元数据管理服务,可以在一个集中的位置跨项目和区域搜索数据集。
如需了解详情,请参阅使用 Data Catalog 搜索模型和数据集资源概览。