每个模型的端到端用户体验历程

BigQuery ML 支持各种机器学习模型以及每个模型的完整机器学习流程,例如特征预处理、模型创建、超参数调节、推理、评估和模型导出。模型的机器学习流程分为以下两个表:

模型创建阶段

模型类别 模型类型 模型创建 特征预处理 超参数调节 模型权重 特征和训练信息 教程
监督式学习 线性回归和逻辑回归 create model 自动预处理
手动预处理1
超参数调节2
ml.trial_info
ml.weights ml.feature_info
ml.training_info
深度神经网络 (DNN) create model 不适用5 不适用
Wide & Deep 网络 create model 不适用5 不适用
提升树 create model 不适用5 不适用
随机森林 create model 不适用5 不适用
AutoML 分类和回归 create model 不适用3 不适用3 不适用5 不适用
非监督式学习 K-means create model 自动预处理
手动预处理1
超参数调节2
ml.trial_info
ml.centroids ml.feature_info
ml.training_info
为自行车站点划分聚类
矩阵分解 create model 不适用 超参数调节2
ml.trial_info
ml.weights
主成分分析 (PCA) create model 自动预处理
手动预处理1
不适用 ml.principal_
components

ml.principal_
component_info
不适用
自动编码器 create model 自动预处理
手动预处理1
超参数调节2
ml.trial_info
不适用5 不适用
时序模型 ARIMA_PLUS create model 自动预处理 auto.ARIMA4 ml.arima_ coefficients ml.feature_info
ml.training_info
ARIMA_PLUS_XREG create model 自动预处理 auto.ARIMA4 ml.arima_ coefficients ml.feature_info
ml.training_info
预测单个时序
生成式 AI 远程模型 基于 Vertex AI 文本生成模型的远程模型6 create model 不适用 不适用 不适用 不适用
基于 Vertex AI 嵌入生成模型的远程模型6 create model 不适用 不适用 不适用 不适用
AI 远程模型 基于 Cloud Vision API 的远程模型 create model 不适用 不适用 不适用 不适用 不适用
基于 Cloud Translation API 的远程模型 create model 不适用 不适用 不适用 不适用 不适用
基于 Cloud Natural Language API 的远程模型 create model 不适用 不适用 不适用 不适用 不适用
基于 Document AI API 的远程模型 create model 不适用 不适用 不适用 不适用 不适用
基于 Speech-to-Text API 的远程模型
create model 不适用 不适用 不适用 不适用 不适用
远程模型 具有 Vertex AI 端点的远程模型 create model 不适用 不适用 不适用 不适用 使用远程模型进行预测
导入的模型 TensorFlow create model 不适用 不适用 不适用 不适用 使用导入的 TensorFlow 模型进行预测
TensorFlow Lite create model 不适用 不适用 不适用 不适用 不适用
开放神经网络交换 (ONNX) create model 不适用 不适用 不适用 不适用
XGBoost create model 不适用 不适用 不适用 不适用 不适用
仅限转换的模型7 仅转换 create model 手动预处理1 不适用 不适用 ml.feature_info 不适用
贡献分析模型 贡献分析
预览版
create model 手动预处理 不适用 不适用 不适用 从贡献分析模型中获取数据洞见

1请参阅使用 TRANSFORM 子句进行特征工程教程。如需详细了解预处理函数,请参阅“BQML - 特征工程函数”教程

2请参阅使用超参数调节提高模型性能教程。

3默认情况下,自动特征工程和超参数调节嵌入在 AutoML 模型训练中。

4auto.ARIMA 算法针对趋势模块执行超参数调节。不支持针对整个建模流水线进行超参数调节。如需了解详情,请参阅建模流水线

5 BigQuery ML 不支持检索以下模型权重的函数:提升树、随机森林、DNN、Wide & Deep、Autoencoder 或 AutoML 模型。如需查看这些模型的权重,您可以将现有模型从 BigQuery ML 导出到 Cloud Storage,然后使用 XGBoost 库或 TensorFlow 库直观呈现树模型的树状结构或神经网络的图结构。如需了解详情,请参阅导出模型文档导出模型教程

6使用 Vertex AI 基础模型或使用监督式调优对其进行自定义。

7 这不是典型机器学习模型,而是将原始数据转换为特征的制品。

模型使用阶段

模型类别 模型类型 评估 推断 AI 说明 模型监控 模型导出 教程
监督式学习 线性回归和逻辑回归 ml.evaluate
ml.confusion_matrix1
ml.roc_curve2
ml.predict
ml.transform
ml.explain_predict3
ml.global_explain
ml.advanced_weights8
ml.describe_data
ml.validate_data_drift
ml.validate_data_skew
ml.tfdv_describe
ml.tfdv_validate
导出模型5
深度神经网络 (DNN) 不适用
Wide & Deep 网络 不适用
提升树 ml.explain_predict3
ml.global_explain
ml.feature_importance4
不适用
随机森林 不适用
AutoML 分类和回归 ml.predict ml.global_explain ml.describe_data
ml.validate_data_drift
ml.tfdv_describe
ml.tfdv_validate
不适用
非监督式学习 K-means ml.evaluate ml.predict
ml.detect_anomalies
ml.transform
不适用 ml.describe_data
ml.validate_data_drift
ml.validate_data_skew
ml.tfdv_describe
ml.tfdv_validate
导出模型5 为自行车站点划分聚类
矩阵分解 ml.recommend
ml.generate_embedding
ml.describe_data
ml.validate_data_drift
ml.tfdv_describe
ml.tfdv_validate
主成分分析 (PCA) ml.predict
ml.generate_embedding
ml.detect_anomalies
ml.transform
ml.describe_data
ml.validate_data_drift
ml.validate_data_skew
ml.tfdv_describe
ml.tfdv_validate
不适用
自动编码器 ml.predict
ml.generate_embedding
ml.detect_anomalies
ml.reconstruction_loss
ml.transform
不适用
时序模型 ARIMA_PLUS ml.evaluate
ml.arima_evaluate6
ml.holiday_info
ml.forecast
ml.detect_anomalies
ml.explain_forecast7 ml.describe_data
ml.validate_data_drift
ml.tfdv_describe
ml.tfdv_validate
不适用
ARIMA_PLUS_XREG ml.forecast
ml.detect_anomalies
ml.describe_data
ml.validate_data_drift
ml.validate_data_skew
ml.tfdv_describe
ml.tfdv_validate
多变量预测
生成式 AI 远程模型 基于 Vertex AI 文本生成模型的远程模型9 ml.evaluate11预览版 ml.generate_text 不适用 ml.describe_data
ml.validate_data_drift
ml.tfdv_describe
ml.tfdv_validate
不适用
基于 Vertex AI 嵌入生成模型的远程模型9 不适用 ml.generate_embedding 不适用 不适用
AI 远程模型 基于 Cloud Vision API 的远程模型 不适用 ml.annotate_image 不适用 ml.describe_data
ml.validate_data_drift
ml.tfdv_describe
ml.tfdv_validate
不适用 不适用
基于 Cloud Translation API 的远程模型 不适用 ml.translate 不适用 不适用 不适用
基于 Cloud Natural Language API 的远程模型 不适用 ml.understand_text 不适用 不适用 不适用
基于 Document AI API 的远程模型 不适用 ml.process_document 不适用 不适用 不适用
基于 Speech-to-Text API 的远程模型 不适用 ml.transcribe 不适用 不适用 不适用
远程模型 具有 Vertex AI 端点的远程模型 不适用 ml.predict 不适用 ml.describe_data
ml.validate_data_drift
ml.tfdv_describe
ml.tfdv_validate
不适用 使用远程模型进行预测
导入的模型 TensorFlow 不适用 ml.predict 不适用 ml.describe_data
ml.validate_data_drift
ml.tfdv_describe
ml.tfdv_validate
导出模型5 使用导入的 TensorFlow 模型进行预测
TensorFlow Lite 不适用 ml.predict 不适用 不适用 不适用
开放神经网络交换 (ONNX) 不适用 ml.predict 不适用 不适用
XGBoost 不适用 ml.predict 不适用 不适用 不适用
仅限转换的模型10 仅转换 不适用 ml.transform 不适用 不适用 导出模型5 不适用
贡献分析模型 贡献分析
预览版
不适用 ml.get_insights 不适用 不适用 不适用 从贡献分析模型中获取数据洞见

1ml.confusion_matrix 仅适用于分类模型。

2ml.roc_curve 仅适用于二元分类模型。

3ml.explain_predictml.predict 的扩展版本。 如需了解详情,请参阅 Explainable AI 概览。如需了解如何使用 ml.explain_predict,请参阅回归教程分类教程

4如需了解 ml.global_explainml.feature_importance 之间的区别,请参阅 Explainable AI 概览

5请参阅导出 BigQuery ML 模型以进行在线预测教程。 如需详细了解在线传送,请参阅“BQML - 使用内嵌转置创建模型”教程

6对于 ARIMA_PLUSARIMA_PLUS_XREG 模型,ml.evaluate 可以将新数据作为输入,以计算平均绝对百分比误差 (MAPE) 等预测指标。在没有新数据的情况下,ml.evaluate 的扩展版本 ml.arima_evaluate 可以输出不同的评估信息。

7ml.explain_forecastml.forecast 的扩展版本。如需了解详情,请参阅 Explainable AI 概览。如需了解如何使用 ml.explain_forecast,请参阅单个时间序列预测多个时间序列预测教程的直观呈现结果步骤。

8ml.advanced_weightsml.weights 的扩展版本,请参阅 ml.advanced_weights 了解详情。

9使用 Vertex AI 基础模型或使用监督式调优对其进行自定义。

10这不是典型机器学习模型,而是将原始数据转换为特征的工件。

11并非所有 Vertex AI LLM 都支持。如需了解详情,请参阅 ml.evaluate