特征预处理概览
特征预处理是机器学习生命周期中最重要的步骤之一。它包括创建特征和清理训练数据。创建特征也称为特征工程。
BigQuery ML 提供以下特征预处理技术:
自动预处理。BigQuery ML 在训练期间执行自动预处理。如需了解详情,请参阅自动特征预处理。
手动预处理。您可以在
CREATE MODEL
语句中使用TRANSFORM
子句,并使用手动预处理函数来定义自定义预处理。您还可以在创建模型之前,在TRANSFORM
子句之外使用这些函数来处理训练数据。
获取特征信息
此外,您还可以使用 ML.FEATURE_INFO
函数检索所有输入特征列的统计信息。
推荐的知识
通过使用 CREATE MODEL
语句和推断函数中的默认设置,即使您没有太多机器学习知识,也可以创建和使用 BigQuery ML 模型。不过,如果您具备机器学习开发生命周期(例如特征工程和模型训练)的基本知识,则有助于您优化数据和模型,从而获得更好的结果。我们建议您使用以下资源来熟悉机器学习技术和流程:
后续步骤
了解 BigQuery ML 中的特征传送。