本页面比较旧版 AutoML 产品和 Vertex AI 上的 AutoML,以帮助旧版 AutoML 用户了解如何使用 Vertex AI。
查看适用于您的使用场景的表格以及可能影响您的工作流的更改。
常规用法
这些差异适用于所有 Vertex AI 用户。
操作 | 旧版 AutoML | Vertex AI |
---|---|---|
模型部署 | 直接部署模型使其可用于在线预测。 |
创建一个 Endpoint 对象来提供用于执行在线预测的资源。然后,将模型部署到端点。调用 predict() 方法来请求预测。 |
使用项目编号或项目 ID |
AutoML 文档的某些部分显示的示例使用 project-number ,其他部分显示的示例使用 project-id 。 |
project-number 和 project-id 都适用于 Vertex AI。 |
AutoML Natural Language 用户
AutoML Natural Language 在 Vertex AI 中使用文本数据类型。
操作 | AutoML Natural Language | Vertex AI |
---|---|---|
训练数据格式 | 您可以使用 CSV 文件添加内嵌文本片段或引用文档。对于实体提取,您可以使用 CSV 或 JSON 行文件来引用文档(不支持内嵌文本)。 | 您可以使用 CSV 或 JSON 行文件(文本实体提取除外)添加内嵌文本片段或引用类型为 TXT 的文档。实体提取仅支持 JSON 行文件。 |
数据集导入 | 使用 CSV 文件指定如何根据机器学习用途拆分数据(用于训练、测试和验证)。 | 您可以在 CSV 的可选列(与数据位于同一行)中指定机器学习用途值;或在与数据相同的 JSON 对象中以 JSON 行格式指定为标记。如果您未指定机器学习用途值,则数据会被自动拆分以用于训练、测试和验证。 对于情感分析,CSV 文件必须在每一行的最后一列包含情感最大值。 |
数据集注释 | 在导入时将注释添加到数据集,或使用 Google Cloud 控制台进行添加。如果要将数据用于具有不同目标的另一个数据集,则必须创建具有不同注释的新数据集。 |
注释组合为一个 AnnotationSet 对象。您可以将不同的注释集用于同一数据集。 |
存储费用 | 加载到内部存储空间的数据集不会产生任何费用。 | 创建数据集时,数据会加载到项目的 Cloud Storage 中。使用此存储空间是需要付费的。 了解详情。 |
为数据加标签 | 将添加标签说明加载到内部存储空间中,并将其添加到任务创建请求中。注释是独立的对象。 |
使用网址提供添加标签说明。注释是 Dataset 对象的一部分,无法使用 API 来操纵。 |
AutoML Vision 和 AutoML Video Intelligence 用户
在 Vertex AI 中,AutoML Vision 和 AutoML Video 分别使用图片和视频数据类型。
操作 | AutoML Vision 和 AutoML Video | Vertex AI |
---|---|---|
数据输入格式 | JSON 行格式不受支持。 | 您的数据源支持 JSON 行格式。 |
数据导入(仅限视频) | 使用双层 CSV 文件为视频指定机器学习用途(训练、测试)。 | 您可以在 CSV 的可选列(与数据位于同一行)中指定机器学习用途值;或在与数据相同的 JSON 对象中以 JSON 行格式指定为标记。如果您未指定机器学习用途值,则数据会被自动拆分以用于训练、测试和验证。 |
数据集注释 | 在导入时将注释添加到数据集,或使用 Google Cloud 控制台进行添加。如果要将数据用于具有不同目标的另一个数据集,则必须创建具有不同注释的新数据集。 |
注释组合为一个 AnnotationSet 对象。您可以将不同的注释集用于同一数据集。 |
存储费用 | 加载到内部存储空间的数据集不会产生任何费用。 | 创建数据集时,数据会加载到项目的 Cloud Storage 中。使用此存储空间是需要付费的。 了解详情。 |
为数据加标签 | 将添加标签说明加载到内部存储空间中,并将其添加到任务创建请求中。注释是独立的对象。 |
使用网址提供添加标签说明。注释是 Dataset 对象的一部分,无法使用 API 来操纵。 |
AutoML Tables 用户
AutoML Tables 在 Vertex AI 中使用表格数据类型。
操作 | AutoML Tables | Vertex AI |
---|---|---|
数据集创建 | 数据导入内部存储空间;数据源的后续更新不会影响 AutoML 数据集。 | 引用而非导入数据源;如果重新训练经过该数据源训练的模型,数据源的后续更新也会体现。 |
检查架构 | 将数据导入数据集时,自动生成有关数据的统计信息。 | 必须手动为数据集生成统计信息。 |
检查架构 | 创建数据集时检查其架构,并确保每个特征集正确无误。使用该数据集训练的未来模型使用此架构设计,除非您明确更改它。 | 使用数据集训练模型时,Vertex AI 会为每个特征创建默认转换;如果默认转换不适合您的数据和目标,您可以进行替换。无效数据可能会导致向时间戳和数字数据类型的转换失败;您可以指定整行失效或者仅该列失效。 |
在导出的模型中执行预测 | 导出的回归模型中执行的预测不返回预测区间。 | 导出的回归模型中执行的预测返回预测区间。 |
特征重要性 | Vertex Explainable AI 提供与 AutoML Tables 的 AI Explanations 类似的功能。您可以对模型使用全局特征重要性,也可以对模型的预测使用特征重要性(特征归因)。 |
API 用户
如需详细了解 API,请参阅 Vertex AI API 参考文档。
操作或实体 | 旧版 AutoML | Vertex AI |
---|---|---|
模型创建 |
使用 model.create() 方法创建模型,该方法返回一个长时间运行的操作。 |
创建 TrainingPipeline 对象,该对象返回训练作业。 |
使用客户端库 | API 有一个 API 客户端。 | 每个 API 资源都有不同的 API 客户端。 |
请求预测 |
通过对模型调用 predict() 方法来请求预测。 |
通过对 Endpoint 资源调用 predict() 方法来请求预测。 |
在线预测端点 | automl.googleapis.com 和部分产品也支持 eu-automl.googleapis.com |
将下行中的 REGION 替换为预测模型所在的区域。REGION-aiplatform.googleapis.com 。
例如:us-central1-aiplatform.googleapis.com |
架构和定义文件 | 请求和响应的所有输入都由 API 服务定义。数据格式是预定义的。 | 某些请求和响应字段在架构和定义文件中定义。数据格式使用预定义的架构文件定义。这为 API 和数据格式提供了灵活性。 |
主机名 | automl.googleapis.com |
aiplatform.googleapis.com |
区域主机名 | 并非所有产品都需要。例如:eu-automl.googleapis.com |
必需。例如:us-central1-aiplatform.googleapis.com |