每个模型的端到端用户体验历程
BigQuery ML 支持各种机器学习模型以及每个模型的完整机器学习流程,例如特征预处理、模型创建、超参数调节、推理、评估和模型导出。模型的机器学习流程分为以下两个表:
模型创建阶段
模型类别 | 模型类型 | 模型创建 | 特征预处理 | 超参数调节 | 模型权重 | 特征和训练信息 | 教程 |
---|---|---|---|---|---|---|---|
监督式学习 | 线性回归和逻辑回归 | create model | 自动预处理、 手动预处理1 |
超参数调节2 ml.trial_info |
ml.weights | ml.feature_info ml.training_info |
|
深度神经网络 (DNN) | create model | 不适用5 | 不适用 | ||||
Wide & Deep 网络 | create model | 不适用5 | 不适用 | ||||
提升树 | create model | 不适用5 | 不适用 | ||||
随机森林 | create model | 不适用5 | 不适用 | ||||
AutoML 分类和回归 | create model | 不适用3 | 不适用3 | 不适用5 | 不适用 | ||
非监督式学习 | K-means | create model | 自动预处理、 手动预处理1 |
超参数调节2 ml.trial_info |
ml.centroids | ml.feature_info ml.training_info |
为自行车站点划分聚类 |
矩阵分解 | create model | 不适用 | 超参数调节2 ml.trial_info |
ml.weights | |||
主成分分析 (PCA) | create model | 自动预处理、 手动预处理1 |
不适用 | ml.principal_ components, ml.principal_ component_info |
不适用 | ||
自动编码器 | create model | 自动预处理、 手动预处理1 |
超参数调节2 ml.trial_info |
不适用5 | 不适用 | ||
时序模型 | ARIMA_PLUS | create model | 自动预处理 | auto.ARIMA4 | ml.arima_ coefficients | ml.feature_info ml.training_info |
|
ARIMA_PLUS_XREG | create model | 自动预处理 | auto.ARIMA4 | ml.arima_ coefficients | ml.feature_info ml.training_info |
多变量预测 | |
生成式 AI 远程模型 | 基于 Vertex AI 文本生成模型的远程模型6 | create model | 不适用 | 不适用 | 不适用 | 不适用 | |
基于 Vertex AI 嵌入生成模型的远程模型6 | create model | 不适用 | 不适用 | 不适用 | 不适用 | ||
AI 远程模型 | 基于 Cloud Vision API 的远程模型 | create model | 不适用 | 不适用 | 不适用 | 不适用 | 不适用 |
基于 Cloud Translation API 的远程模型 | create model | 不适用 | 不适用 | 不适用 | 不适用 | 不适用 | |
基于 Cloud Natural Language API 的远程模型 | create model | 不适用 | 不适用 | 不适用 | 不适用 | 不适用 | |
基于 Document AI API 的远程模型 | create model | 不适用 | 不适用 | 不适用 | 不适用 | 不适用 | |
基于 Speech-to-Text API 的远程模型 |
create model | 不适用 | 不适用 | 不适用 | 不适用 | 不适用 | |
远程模型 | 具有 Vertex AI 端点的远程模型 | create model | 不适用 | 不适用 | 不适用 | 不适用 | 使用远程模型进行预测 |
导入的模型 | TensorFlow | create model | 不适用 | 不适用 | 不适用 | 不适用 | 使用导入的 TensorFlow 模型进行预测 |
TensorFlow Lite | create model | 不适用 | 不适用 | 不适用 | 不适用 | 不适用 | |
开放神经网络交换 (ONNX) | create model | 不适用 | 不适用 | 不适用 | 不适用 | ||
XGBoost | create model | 不适用 | 不适用 | 不适用 | 不适用 | 不适用 | |
仅限转换的模型7 | 仅转换 | create model | 手动预处理1 | 不适用 | 不适用 | ml.feature_info | 不适用 |
贡献分析模型 | 贡献分析 (预览版) |
create model | 手动预处理 | 不适用 | 不适用 | 不适用 | 从贡献分析模型中获取数据洞见 |
1请参阅使用 TRANSFORM 子句进行特征工程教程。如需详细了解预处理函数,请参阅“BQML - 特征工程函数”教程。
2请参阅使用超参数调节提高模型性能教程。
3默认情况下,自动特征工程和超参数调节嵌入在 AutoML 模型训练中。
4auto.ARIMA 算法针对趋势模块执行超参数调节。不支持针对整个建模流水线进行超参数调节。如需了解详情,请参阅建模流水线。
5 BigQuery ML 不支持检索以下模型权重的函数:提升树、随机森林、DNN、Wide & Deep、Autoencoder 或 AutoML 模型。如需查看这些模型的权重,您可以将现有模型从 BigQuery ML 导出到 Cloud Storage,然后使用 XGBoost 库或 TensorFlow 库直观呈现树模型的树状结构或神经网络的图结构。如需了解详情,请参阅导出模型文档和导出模型教程。
6使用 Vertex AI 基础模型或使用监督式调优对其进行自定义。
7 这不是典型机器学习模型,而是将原始数据转换为特征的制品。
模型使用阶段
1ml.confusion_matrix
仅适用于分类模型。
2ml.roc_curve
仅适用于二元分类模型。
3ml.explain_predict
是 ml.predict
的扩展版本。
如需了解详情,请参阅 Explainable AI 概览。如需了解如何使用 ml.explain_predict
,请参阅回归教程和分类教程。
4如需了解 ml.global_explain
和 ml.feature_importance
之间的区别,请参阅 Explainable AI 概览。
5请参阅导出 BigQuery ML 模型以进行在线预测教程。 如需详细了解在线传送,请参阅“BQML - 使用内嵌转置创建模型”教程。
6对于 ARIMA_PLUS
或 ARIMA_PLUS_XREG
模型,ml.evaluate
可以将新数据作为输入,以计算平均绝对百分比误差 (MAPE) 等预测指标。在没有新数据的情况下,ml.evaluate
的扩展版本 ml.arima_evaluate
可以输出不同的评估信息。
7ml.explain_forecast
是 ml.forecast
的扩展版本。如需了解详情,请参阅 Explainable AI 概览。如需了解如何使用 ml.explain_forecast
,请参阅单个时间序列预测和多个时间序列预测教程的直观呈现结果步骤。
8ml.advanced_weights
是 ml.weights
的扩展版本,请参阅 ml.advanced_weights 了解详情。
9使用 Vertex AI 基础模型或使用监督式调优对其进行自定义。
10这不是典型机器学习模型,而是将原始数据转换为特征的工件。
11并非所有 Vertex AI LLM 都支持。如需了解详情,请参阅 ml.evaluate。