本文档介绍了使用 AutoML 或自定义训练在 Vertex AI 中训练模型与使用 BigQuery ML 训练模型之间的主要区别。
借助 AutoML,您只需极少的技术工作即可创建和训练模型。您可以使用 AutoML 对模型进行快速原型设计并探索新的数据集,然后再投资开发。例如,您可以用它了解最适合给定数据集的特征。
借助自定义训练,您可以创建一个根据目标结果进行了优化的训练应用。您可以完全控制应用训练功能。也就是说,您可以定位任何目标、使用任何算法、开发自己的损失函数或指标,或者进行任何其他自定义。
借助 BigQuery ML,您可以直接在 BigQuery 中使用 BigQuery 数据训练模型。使用 SQL 命令,您可以快速创建模型并使用它进行批量预测。
如需比较每项服务所需的不同功能和专业知识,请参阅下表。
AutoML | 自定义训练 | BigQuery ML | |
---|---|---|---|
需要数据科学专业知识 | 否 | 是,用于开发训练应用,以及完成特征工程等数据准备。 | 不需要 |
需要编程能力 | 否,AutoML 是无代码的。 | 是,用于开发训练应用。 | 在 BigQuery ML 中构建、评估和使用模型所需的 SQL 编程能力。 |
训练模型的时间 | 降低。所需的数据准备工作较少,无需开发。 | 提高。需要更多数据准备工作,还需要训练应用开发。 | 降低。模型开发速度提高,因为您不需要构建批量预测或模型训练所需的基础设施,因为 BigQuery ML 会利用 BigQuery 计算引擎。这提高了训练、评估和预测的速度。 |
机器学习目标的限制 | 可以,您必须定位 AutoML 的某一预定义目标。 | 否 | 是。 |
可以通过超参数调节手动优化模型性能 | 否。AutoML 会执行一些自动超参数调节,但无法修改所用的值。 | 可以。您可以在每个训练运行期间调整模型,以便进行实验和比较。 | 可以。使用 `CREATE MODEL` 语句训练机器学习模型时,BigQuery ML 支持超参数调节。 |
可以控制训练环境的各个方面 | 受限。对于图片和表格数据集,您可以指定要进行训练的节点时数,以及是否允许训练提前停止。 | 可以。您可以指定环境的各个方面,例如 Compute Engine 机器类型、磁盘大小、机器学习框架和节点数。 | 不需要 |
数据大小限制 |
可以。AutoML 使用托管数据集;数据大小限制因数据集类型而异。请参阅下列主题之一,了解详细信息: |
对于非托管数据集,否。托管数据集与 Vertex AI 创建和托管的托管数据集对象拥有相同的限制,并用于训练 AutoML 模型。 | 可以。BigQuery ML 按项目实施相应的配额。如需了解详情,请参阅配额和限制。 |
后续步骤
- 选择入门教程以开始使用 Vertex AI Training。
- 详细了解训练 AutoML 模型。
- 了解如何使用 Python 创建自定义训练作业。