每个模型的端到端用户体验历程

BigQuery ML 支持各种机器学习模型以及每个模型的完整机器学习流程，例如特征预处理、模型创建、超参数调节、推断、评估和模型导出。模型的机器学习流程分为以下两个表：

模型创建阶段
模型使用阶段

模型创建阶段

模型类别	模型类型	模型创建	特征预处理	超参数调节	模型权重	特征和训练信息	教程
监督式学习	线性回归和逻辑回归	create model	自动预处理、手动预处理¹	超参数调节² ml.trial_info	ml.weights	ml.feature_info ml.training_info	回归分类
	深度神经网络 (DNN)	create model			不适用⁵		不适用
	Wide & Deep 网络	create model			不适用⁵		不适用
	提升树	create model			不适用⁵		不适用
	随机森林	create model			不适用⁵		不适用
	AutoML 分类和回归	create model	不适用³	不适用³	不适用⁵		不适用
非监督式学习	K-means	create model	自动预处理、手动预处理¹	超参数调节² ml.trial_info	ml.centroids	ml.feature_info ml.training_info	为自行车站点划分聚类
	矩阵分解	create model	不适用	超参数调节² ml.trial_info	ml.weights		显式反馈隐式反馈
	主成分分析 (PCA)	create model	自动预处理、手动预处理¹	不适用	ml.principal_ components、 ml.principal_ component_info		不适用
	自动编码器	create model	自动预处理、手动预处理¹	超参数调节² ml.trial_info	不适用⁵		不适用
时序模型	ARIMA_PLUS	create model	自动预处理	auto.ARIMA⁴	ml.arima_ coefficients	ml.feature_info ml.training_info	单个时序多个时序数百万个时序自定义节假日限制预测值分层时序预测
时序模型	ARIMA_PLUS_XREG	create model	自动预处理	auto.ARIMA⁴	ml.arima_ coefficients	ml.feature_info ml.training_info	多变量预测
导入的模型	TensorFlow	create model	不适用	不适用	不适用	不适用	使用导入的 TensorFlow 模型进行预测
	TensorFlow Lite	create model	不适用	不适用	不适用	不适用	不适用
	开放神经网络交换 (ONNX)	create model	不适用	不适用	不适用	不适用	使用 ONNX 格式的 scikit-learn 模型进行预测使用 ONNX 格式的 PyTorch 模型进行预测
	XGBoost	create model	不适用	不适用	不适用	不适用	不适用
远程模型	具有 Vertex AI 端点的远程模型	create model	不适用	不适用	不适用	不适用	使用远程模型进行预测
	基于 Cloud Vision API 的远程模型	create model	不适用	不适用	不适用	不适用	不适用
	基于 Cloud Translation API 的远程模型	create model	不适用	不适用	不适用	不适用	不适用
	基于 Cloud Natural Language API 的远程模型	create model	不适用	不适用	不适用	不适用	不适用
	基于 Vertex AI 大型语言模型 (LLM) 的远程模型⁶	create model	不适用	不适用	不适用	不适用	使用远程模型生成文本使用远程模型生成文本嵌入使用远程模型生成图片嵌入
	基于 Document AI API 的远程模型（预览版）	create model	不适用	不适用	不适用	不适用	不适用
	基于 Speech-to-Text API 的远程模型（预览版）	create model	不适用	不适用	不适用	不适用	不适用
仅限转换的模型⁷	仅限转换（预览版）	create model	手动预处理¹	不适用	不适用	ml.feature_info	不适用

¹请参阅使用 TRANSFORM 子句进行特征工程教程。如需详细了解预处理函数，请参阅“BQML - 特征工程函数”教程。

²请参阅使用超参数调节提高模型性能教程。

³默认情况下，自动特征工程和超参数调节嵌入在 AutoML 模型训练中。

⁴auto.ARIMA 算法针对趋势模块执行超参数调节。不支持针对整个建模流水线进行超参数调节。如需了解详情，请参阅建模流水线。

⁵ BigQuery ML 不支持检索以下模型权重的函数：提升树、随机森林、DNN、Wide & Deep、Autoencoder 或 AutoML 模型。如需查看这些模型的权重，您可以将现有模型从 BigQuery ML 导出到 Cloud Storage，然后使用 XGBoost 库或 TensorFlow 库直观呈现树模型的树状结构或神经网络的图结构。如需了解详情，请参阅导出模型文档和导出模型教程。

⁶使用 Vertex AI 基础模型或使用监督式调优对其进行自定义。

⁷这不是典型机器学习模型，而是将原始数据转换为特征的工件。

模型使用阶段

模型类别	模型类型	评估	推断	AI 说明	模型监控	模型导出	教程
监督式学习	线性回归和逻辑回归	ml.evaluate ml.confusion_matrix¹ ml.roc_curve²	ml.predict ml.transform	ml.explain_predict³ ml.global_explain ml.advanced_weights⁸	ml.describe_data ml.validate_data_drift ml.validate_data_skew ml.tfdv_describe ml.tfdv_validate	导出模型⁵	回归分类
	深度神经网络 (DNN)						不适用
	Wide & Deep 网络						不适用
	提升树			ml.explain_predict³ ml.global_explain ml.feature_importance⁴			不适用
	随机森林						不适用
	AutoML 分类和回归		ml.predict	ml.global_explain			不适用
非监督式学习	K-means	ml.evaluate	ml.predict ml.detect_anomalies ml.transform	不适用	ml.describe_data ml.validate_data_drift ml.validate_data_skew ml.tfdv_describe ml.tfdv_validate	导出模型⁵	为自行车站点划分聚类
	矩阵分解		ml.recommend ml.generate_embedding（预览版）				显式反馈隐式反馈
	主成分分析 (PCA)		ml.predict ml.generate_embedding（预览版） ml.detect_anomalies ml.transform				不适用
	自动编码器		ml.predict ml.generate_embedding（预览版） ml.detect_anomalies ml.reconstruction_loss ml.transform				不适用
时序模型	ARIMA_PLUS	ml.evaluate ml.arima_evaluate⁶ ml.holiday_info	ml.forecast ml.detect_anomalies	ml.explain_forecast⁷	ml.describe_data ml.validate_data_drift ml.validate_data_skew ml.tfdv_describe ml.tfdv_validate	不适用	单个时序多个时序数百万个时序自定义节假日限制预测值分层时序预测
时序模型	ARIMA_PLUS_XREG	ml.evaluate ml.arima_evaluate⁶ ml.holiday_info	ml.forecast ml.detect_anomalies （预览版）	ml.explain_forecast⁷		不适用	多变量预测
导入的模型	TensorFlow	不适用	ml.predict	不适用	ml.describe_data ml.validate_data_drift ml.validate_data_skew ml.tfdv_describe ml.tfdv_validate	导出模型⁵	使用导入的 TensorFlow 模型进行预测
	TensorFlow Lite	不适用	ml.predict	不适用		不适用	不适用
	开放神经网络交换 (ONNX)	不适用	ml.predict	不适用		不适用	使用 ONNX 格式的 scikit-learn 模型进行预测使用 ONNX 格式的 PyTorch 模型进行预测
	XGBoost	不适用	ml.predict	不适用		不适用	不适用
远程模型	具有 Vertex AI 端点的远程模型	不适用	ml.predict	不适用	ml.describe_data ml.validate_data_drift ml.validate_data_skew ml.tfdv_describe ml.tfdv_validate	不适用	使用远程模型进行预测
	基于 Cloud Vision API 的远程模型	不适用	ml.annotate_image	不适用		不适用	不适用
	基于 Cloud Translation API 的远程模型	不适用	ml.translate	不适用		不适用	不适用
	基于 Cloud Natural Language API 的远程模型	不适用	ml.understand_text	不适用		不适用	不适用
	基于 Vertex AI 大型语言模型 (LLM) 的远程模型⁹	ml.evaluate¹¹（预览版）	ml.generate_text ml.generate_embedding	不适用		不适用	使用远程模型生成文本使用远程模型生成文本嵌入使用远程模型生成图片嵌入
	基于 Document AI API 的远程模型（预览版）	不适用	ml.process_document	不适用		不适用	不适用
	基于 Speech-to-Text API 的远程模型（预览版）	不适用	ml.transcribe	不适用		不适用	不适用
仅限转换的模型¹⁰ （预览版）	仅限转换（预览版）	不适用	ml.transform	不适用	不适用	导出模型⁵	不适用

¹ml.confusion_matrix 仅适用于分类模型。

²ml.roc_curve 仅适用于二元分类模型。

³ml.explain_predict 是 ml.predict 的扩展版本。如需了解详情，请参阅 Explainable AI 概览。如需了解如何使用 ml.explain_predict，请参阅回归教程和分类教程。

⁴如需了解 ml.global_explain 和 ml.feature_importance 之间的区别，请参阅 Explainable AI 概览。

⁵请参阅导出 BigQuery ML 模型以进行在线预测教程。如需详细了解在线传送，请参阅“BQML - 使用内嵌转置创建模型”教程。

⁶对于 ARIMA_PLUS 或 ARIMA_PLUS_XREG 模型，ml.evaluate 可以将新数据作为输入，以计算平均绝对百分比误差 (MAPE) 等预测指标。在没有新数据的情况下，ml.evaluate 的扩展版本 ml.arima_evaluate 可以输出不同的评估信息。

⁷ml.explain_forecast 是 ml.forecast 的扩展版本。如需了解详情，请参阅 Explainable AI 概览。如需了解如何使用 ml.explain_forecast，请参阅单个时间序列预测和多个时间序列预测教程的直观呈现结果步骤。

⁸ml.advanced_weights 是 ml.weights 的扩展版本，请参阅 ml.advanced_weights 了解详情。

⁹使用 Vertex AI 基础模型或使用监督式调优对其进行自定义。

¹⁰这不是典型机器学习模型，而是将原始数据转换为特征的工件。

¹¹并非所有 Vertex AI LLM 都支持。如需了解详情，请参阅 ml.evaluate。