特征预处理概览

特征预处理是机器学习生命周期中最重要的步骤之一。它包括创建特征和清理训练数据。创建特征也称为特征工程。

BigQuery ML 提供以下特征预处理技术:

  • 自动预处理。BigQuery ML 在训练期间执行自动预处理。如需了解详情,请参阅自动特征预处理

  • 手动预处理。您可以在 CREATE MODEL 语句中使用 TRANSFORM 子句,并使用手动预处理函数来定义自定义预处理。您还可以在创建模型之前,在 TRANSFORM 子句之外使用这些函数来处理训练数据。

获取特征信息

此外,您还可以使用 ML.FEATURE_INFO 函数检索所有输入特征列的统计信息。

通过使用 CREATE MODEL 语句和推断函数中的默认设置,即使您没有太多机器学习知识,也可以创建和使用 BigQuery ML 模型。不过,如果您具备机器学习开发生命周期(例如特征工程和模型训练)的基本知识,则有助于您优化数据和模型,从而获得更好的结果。我们建议您使用以下资源来熟悉机器学习技术和流程:

后续步骤

了解 BigQuery ML 中的特征传送