Vertex AI for AutoML 用户

本页面比较旧版 AutoML 产品和 Vertex AI 上的 AutoML,以帮助旧版 AutoML 用户了解如何使用 Vertex AI。

查看适用于您的使用场景的表格以及可能影响您的工作流的更改。

常规用法

这些差异适用于所有 Vertex AI 用户。

操作 旧版 AutoML Vertex AI
模型部署 直接部署模型使其可用于在线预测。 创建一个 Endpoint 对象来提供用于执行在线预测的资源。然后,将模型部署到端点。调用 predict() 方法来请求预测。
使用项目编号或项目 ID AutoML 文档的某些部分显示的示例使用 project-number,其他部分显示的示例使用 project-id project-numberproject-id 都适用于 Vertex AI。

AutoML Natural Language 用户

AutoML Natural Language 在 Vertex AI 中使用文本数据类型

操作 AutoML Natural Language Vertex AI
训练数据格式 您可以使用 CSV 文件添加内嵌文本片段或引用文档。对于实体提取,您可以使用 CSV 或 JSON 行文件来引用文档(不支持内嵌文本)。 您可以使用 CSV 或 JSON 行文件(文本实体提取除外)添加内嵌文本片段或引用类型为 TXT 的文档。实体提取仅支持 JSON 行文件。
数据集导入 使用 CSV 文件指定如何根据机器学习用途拆分数据(用于训练、测试和验证)。 您可以在 CSV 的可选列(与数据位于同一行)中指定机器学习用途值;或在与数据相同的 JSON 对象中以 JSON 行格式指定为标记。如果您未指定机器学习用途值,则数据会被自动拆分以用于训练、测试和验证。
对于情感分析,CSV 文件必须在每一行的最后一列包含情感最大值。
数据集注释 在导入时将注释添加到数据集,或使用 Google Cloud 控制台进行添加。如果要将数据用于具有不同目标的另一个数据集,则必须创建具有不同注释的新数据集。 注释组合为一个 AnnotationSet 对象。您可以将不同的注释集用于同一数据集。
存储费用 加载到内部存储空间的数据集不会产生任何费用。 创建数据集时,数据会加载到项目的 Cloud Storage 中。使用此存储空间是需要付费的。 了解详情
为数据加标签 将添加标签说明加载到内部存储空间中,并将其添加到任务创建请求中。注释是独立的对象。 使用网址提供添加标签说明。注释是 Dataset 对象的一部分,无法使用 API 来操纵。

AutoML Vision 和 AutoML Video Intelligence 用户

在 Vertex AI 中,AutoML Vision 和 AutoML Video 分别使用图片视频数据类型

操作 AutoML Vision 和 AutoML Video Vertex AI
数据输入格式 JSON 行格式不受支持。 您的数据源支持 JSON 行格式。
数据导入(仅限视频) 使用双层 CSV 文件为视频指定机器学习用途(训练、测试)。 您可以在 CSV 的可选列(与数据位于同一行)中指定机器学习用途值;或在与数据相同的 JSON 对象中以 JSON 行格式指定为标记。如果您未指定机器学习用途值,则数据会被自动拆分以用于训练、测试和验证。
数据集注释 在导入时将注释添加到数据集,或使用 Google Cloud 控制台进行添加。如果要将数据用于具有不同目标的另一个数据集,则必须创建具有不同注释的新数据集。 注释组合为一个 AnnotationSet 对象。您可以将不同的注释集用于同一数据集。
存储费用 加载到内部存储空间的数据集不会产生任何费用。 创建数据集时,数据会加载到项目的 Cloud Storage 中。使用此存储空间是需要付费的。 了解详情
为数据加标签 将添加标签说明加载到内部存储空间中,并将其添加到任务创建请求中。注释是独立的对象。 使用网址提供添加标签说明。注释是 Dataset 对象的一部分,无法使用 API 来操纵。

AutoML Tables 用户

AutoML Tables 在 Vertex AI 中使用表格数据类型

操作 AutoML Tables Vertex AI
数据集创建 数据导入内部存储空间;数据源的后续更新不会影响 AutoML 数据集。 引用而非导入数据源;如果重新训练经过该数据源训练的模型,数据源的后续更新也会体现。
检查架构 将数据导入数据集时,自动生成有关数据的统计信息。 必须手动为数据集生成统计信息。
检查架构 创建数据集时检查其架构,并确保每个特征集正确无误。使用该数据集训练的未来模型使用此架构设计,除非您明确更改它。 使用数据集训练模型时,Vertex AI 会为每个特征创建默认转换;如果默认转换不适合您的数据和目标,您可以进行替换。无效数据可能会导致向时间戳和数字数据类型的转换失败;您可以指定整行失效或者仅该列失效。
在导出的模型中执行预测 导出的回归模型中执行的预测不返回预测区间。 导出的回归模型中执行的预测返回预测区间。
特征重要性 Vertex Explainable AI 提供与 AutoML Tables 的 AI Explanations 类似的功能。您可以对模型使用全局特征重要性,也可以对模型的预测使用特征重要性(特征归因)。

API 用户

如需详细了解 API,请参阅 Vertex AI API 参考文档

操作或实体 旧版 AutoML Vertex AI
模型创建 使用 model.create() 方法创建模型,该方法返回一个长时间运行的操作。 创建 TrainingPipeline 对象,该对象返回训练作业。
使用客户端库 API 有一个 API 客户端。 每个 API 资源都有不同的 API 客户端。
请求预测 通过对模型调用 predict() 方法来请求预测。 通过对 Endpoint 资源调用 predict() 方法来请求预测。
在线预测端点 automl.googleapis.com 和部分产品也支持 eu-automl.googleapis.com 将下行中的 REGION 替换为预测模型所在的区域。
REGION-aiplatform.googleapis.com。 例如:
us-central1-aiplatform.googleapis.com
架构和定义文件 请求和响应的所有输入都由 API 服务定义。数据格式是预定义的。 某些请求和响应字段在架构和定义文件中定义。数据格式使用预定义的架构文件定义。这为 API 和数据格式提供了灵活性。
主机名 automl.googleapis.com aiplatform.googleapis.com
区域主机名 并非所有产品都需要。例如:
eu-automl.googleapis.com
必需。例如:
us-central1-aiplatform.googleapis.com

后续步骤