选择训练方法

本主题介绍了使用 AutoML 或自定义训练在 Vertex AI 中训练模型与使用 BigQuery ML 训练模型之间的主要区别。

借助 AutoML,您只需极少的技术工作即可创建和训练模型。您可以使用 AutoML 对模型进行快速原型设计并探索新的数据集,然后再投资开发。例如,您可以用它了解最适合给定数据集的特征。

借助自定义训练,您可以创建一个根据目标结果进行了优化的训练应用。您可以完全控制应用训练功能。也就是说,您可以定位任何目标、使用任何算法、开发自己的损失函数或指标,或者进行任何其他自定义。

借助 BigQuery ML,您可以直接在 BigQuery 中使用 BigQuery 数据训练模型。使用 SQL 命令,您可以快速创建模型并使用它进行批量预测。

如需比较每项服务所需的不同功能和专业知识,请参阅下表。

AutoML 自定义训练 BigQuery ML
需要数据科学专业知识 是,用于开发训练应用,以及完成特征工程等数据准备。 没有。
需要编程能力 否,AutoML 是无代码的。 是,用于开发训练应用。 在 BigQuery ML 中构建、评估和使用模型所需的 SQL 编程能力。
训练模型的时间 降低。所需的数据准备工作较少,无需开发。 提高。需要更多数据准备工作,还需要训练应用开发。 降低。模型开发速度提高,因为您不需要构建批量预测或模型训练所需的基础架构,因为 BigQuery ML 会利用 BigQuery 计算引擎。这提高了训练、评估和预测的速度。
机器学习目标的限制 可以,您必须定位 AutoML 的某一预定义目标。 是。
可以通过超参数调节手动优化模型性能 否。AutoML 会执行一些自动超参数调节,但无法修改所用的值。 是。您可以在每个训练运行期间调整模型,以便进行实验和比较。 是。使用 `CREATE MODEL` 语句训练机器学习模型时,BigQuery ML 支持超参数调节。
可以控制训练环境的各个方面 受限。对于图片和表格数据集,您可以指定要进行训练的节点时数,以及是否允许训练提前停止。 是。您可以指定环境的各个方面,例如 Compute Engine 机器类型、磁盘大小、机器学习框架和节点数。 没有。
数据大小限制

是。AutoML 使用托管数据集;数据大小限制因数据集类型而异。请参阅下列主题之一,了解详细信息:

对于非托管数据集,否。托管数据集与 Vertex AI 创建和托管的托管数据集对象拥有相同的限制,并用于训练 AutoML 模型。 可以。BigQuery ML 按项目实施相应的配额。如需了解详情,请参阅配额和限制

后续步骤