机器学习模型的端到端用户体验历程

本文档介绍了在 BigQuery ML 中训练的机器学习 (ML) 模型的用户体验历程，包括可用于处理 ML 模型的语句和函数。BigQuery ML 提供以下类型的机器学习模型：

监督式学习模型：
无监督学习模型：
仅转换模型：仅转换模型不是典型的机器学习模型，而是将原始数据转换为特征的制品。

模型创建用户体验历程

下表介绍了可用于创建和调整模型的语句和函数：

模型类别	模型类型	模型创建	特征预处理	超参数调优¹	模型权重	特征和训练信息	教程
监督式学习	线性回归和逻辑回归	`CREATE MODEL`	自动预处理手动预处理	超参数调优 `ML.TRIAL _INFO`	`ML.WEIGHTS`	`ML.FEATURE _INFO` `ML.TRAINING _INFO`	使用线性回归预测企鹅体重使用逻辑回归模型执行分类
	深度神经网络 (DNN)	`CREATE MODEL`	自动预处理手动预处理	超参数调优 `ML.TRIAL _INFO`	不适用²	`ML.FEATURE _INFO` `ML.TRAINING _INFO`	不适用
	Wide & Deep 网络	`CREATE MODEL`	自动预处理手动预处理	超参数调优 `ML.TRIAL _INFO`	不适用²	`ML.FEATURE _INFO` `ML.TRAINING _INFO`	不适用
	提升树	`CREATE MODEL`	自动预处理手动预处理	超参数调优 `ML.TRIAL _INFO`	不适用²	`ML.FEATURE _INFO` `ML.TRAINING _INFO`	使用提升树模型执行分类
	随机森林	`CREATE MODEL`	自动预处理手动预处理	超参数调优 `ML.TRIAL _INFO`	不适用²	`ML.FEATURE _INFO` `ML.TRAINING _INFO`	不适用
	AutoML 分类和回归	`CREATE MODEL`	AutoML 会自动执行特征工程	AutoML 会自动执行超参数调优	不适用²	`ML.FEATURE _INFO` `ML.TRAINING _INFO`	不适用
非监督式学习	K-means	`CREATE MODEL`	自动预处理手动预处理	超参数调优 `ML.TRIAL _INFO`	`ML.CENTROIDS`	`ML.FEATURE _INFO` `ML.TRAINING _INFO`	在自行车站点数据中查找聚类
	矩阵分解	`CREATE MODEL`	不适用	超参数调优 `ML.TRIAL _INFO`	`ML.WEIGHTS`	`ML.FEATURE _INFO` `ML.TRAINING _INFO`	使用显式反馈生成影片推荐使用隐式反馈生成内容推荐
	主成分分析 (PCA)	`CREATE MODEL`	自动预处理手动预处理	不适用	`ML.PRINCIPAL _COMPONENTS` `ML.PRINCIPAL _COMPONENT _INFO`	`ML.FEATURE _INFO` `ML.TRAINING _INFO`	不适用
	自动编码器	`CREATE MODEL`	自动预处理手动预处理	超参数调优 `ML.TRIAL _INFO`	不适用²	`ML.FEATURE _INFO` `ML.TRAINING _INFO`	不适用
仅转换	仅转换	`CREATE MODEL`	手动预处理	不适用	不适用	`ML.FEATURE _INFO`	不适用

¹如需查看有关使用超参数调优的分步示例，请参阅使用超参数调优提高模型性能。

²BigQuery ML 未提供用于检索此模型权重的函数。如需查看模型的权重，您可以将模型从 BigQuery ML 导出到 Cloud Storage，然后使用 XGBoost 库或 TensorFlow 库直观呈现树模型的树状结构或神经网络的图结构。如需了解详情，请参阅 EXPORT MODEL 和导出 BigQuery ML 模型以进行在线预测。

模型使用用户体验历程

下表介绍了可用于评估、解释模型并从模型获取预测结果的语句和函数：

模型类别	模型类型	评估	推断	AI 说明	模型监控
监督式学习	线性回归和逻辑回归	`ML.EVALUATE` `ML.CONFUSION _MATRIX`¹ `ML.ROC_CURVE`²	`ML.PREDICT` `ML.TRANSFORM`	`ML.EXPLAIN_PREDICT`³ `ML.GLOBAL_EXPLAIN` `ML.ADVANCED_WEIGHTS`⁵	`ML.DESCRIBE_DATA` `ML.VALIDATE_DATA _DRIFT` `ML.VALIDATE_DATA _SKEW` `ML.TFDV_DESCRIBE` `ML.TFDV_VALIDATE`
	深度神经网络 (DNN)	`ML.EVALUATE` `ML.CONFUSION _MATRIX`¹ `ML.ROC_CURVE`²	`ML.PREDICT` `ML.TRANSFORM`	`ML.EXPLAIN_PREDICT`³ `ML.GLOBAL_EXPLAIN` `ML.ADVANCED_WEIGHTS`⁵	`ML.DESCRIBE_DATA` `ML.VALIDATE_DATA _DRIFT` `ML.VALIDATE_DATA _SKEW` `ML.TFDV_DESCRIBE` `ML.TFDV_VALIDATE`
	Wide & Deep 网络	`ML.EVALUATE` `ML.CONFUSION _MATRIX`¹ `ML.ROC_CURVE`²	`ML.PREDICT` `ML.TRANSFORM`	`ML.EXPLAIN_PREDICT`³ `ML.GLOBAL_EXPLAIN` `ML.ADVANCED_WEIGHTS`⁵	`ML.DESCRIBE_DATA` `ML.VALIDATE_DATA _DRIFT` `ML.VALIDATE_DATA _SKEW` `ML.TFDV_DESCRIBE` `ML.TFDV_VALIDATE`
	提升树	`ML.EVALUATE` `ML.CONFUSION _MATRIX`¹ `ML.ROC_CURVE`²	`ML.PREDICT` `ML.TRANSFORM`	`ML.EXPLAIN_PREDICT`³ `ML.GLOBAL_EXPLAIN` `ML.FEATURE_IMPORTANCE`⁴	`ML.DESCRIBE_DATA` `ML.VALIDATE_DATA _DRIFT` `ML.VALIDATE_DATA _SKEW` `ML.TFDV_DESCRIBE` `ML.TFDV_VALIDATE`
	随机森林	`ML.EVALUATE` `ML.CONFUSION _MATRIX`¹ `ML.ROC_CURVE`²	`ML.PREDICT` `ML.TRANSFORM`	`ML.EXPLAIN_PREDICT`³ `ML.GLOBAL_EXPLAIN` `ML.FEATURE_IMPORTANCE`⁴	`ML.DESCRIBE_DATA` `ML.VALIDATE_DATA _DRIFT` `ML.VALIDATE_DATA _SKEW` `ML.TFDV_DESCRIBE` `ML.TFDV_VALIDATE`
	AutoML 分类和回归	`ML.EVALUATE` `ML.CONFUSION _MATRIX`¹ `ML.ROC_CURVE`²	`ML.PREDICT`	`ML.GLOBAL_EXPLAIN`	`ML.DESCRIBE_DATA` `ML.VALIDATE_DATA _DRIFT` `ML.VALIDATE_DATA _SKEW` `ML.TFDV_DESCRIBE` `ML.TFDV_VALIDATE`
非监督式学习	K-means	`ML.EVALUATE`	`ML.PREDICT` `ML.DETECT _ANOMALIES` `ML.TRANSFORM`	不适用	`ML.DESCRIBE_DATA` `ML.VALIDATE_DATA _DRIFT` `ML.VALIDATE_DATA _SKEW` `ML.TFDV_DESCRIBE` `ML.TFDV_VALIDATE`
	矩阵分解	`ML.EVALUATE`	`ML.RECOMMEND` `ML.GENERATE _EMBEDDING`	不适用	不适用
	主成分分析 (PCA)	`ML.EVALUATE`	`ML.PREDICT` `ML.GENERATE _EMBEDDING` `ML.DETECT _ANOMALIES` `ML.TRANSFORM`	不适用	`ML.DESCRIBE_DATA` `ML.VALIDATE_DATA _DRIFT` `ML.VALIDATE_DATA _SKEW` `ML.TFDV_DESCRIBE` `ML.TFDV_VALIDATE`
	自动编码器	`ML.EVALUATE`	`ML.PREDICT` `ML.GENERATE _EMBEDDING` `ML.DETECT _ANOMALIES` `ML.RECONSTRUCTION _LOSS` `ML.TRANSFORM`	不适用	`ML.DESCRIBE_DATA` `ML.VALIDATE_DATA _DRIFT` `ML.VALIDATE_DATA _SKEW` `ML.TFDV_DESCRIBE` `ML.TFDV_VALIDATE`
仅转换	仅转换	不适用	`ML.TRANSFORM`	不适用	不适用

¹ML.CONFUSION_MATRIX 仅适用于分类模型。

²ML.ROC_CURVE 仅适用于二元分类模型。

³ML.EXPLAIN_PREDICT 函数涵盖了 ML.PREDICT 函数，因为其输出是 ML.PREDICT 结果的超集。

⁴如需了解 ML.GLOBAL_EXPLAIN 和 ML.FEATURE_IMPORTANCE 之间的区别，请参阅 Explainable AI 概览。

⁵ML.ADVANCED_WEIGHTS 函数涵盖了 ML.WEIGHTS 函数，因为其输出是 ML.WEIGHTS 结果的超集。