BigQuery ML 模型权重概览
本文档介绍了 BigQuery ML 如何支持机器学习 (ML) 模型的模型权重可检测性。
机器学习模型是在对训练数据运行机器学习算法后保存的工件。该模型表示进行预测所需的规则、数字和任何其他特定于算法的数据结构。下面是一些示例:
- 线性回归模型由具有特定值的系数矢量组成。
- 决策树模型由一个或多个具有特定值的 if-then 语句树组成。
- 深度神经网络模型由具有特定值的权重矢量或矩阵的图结构组成。
在 BigQuery ML 中,模型权重用于描述组成模型的组件。
如需了解每种模型类型支持的 SQL 语句和函数,请参阅每个模型的端到端用户体验历程。
BigQuery ML 中的模型权重产品
BigQuery ML 提供了多种函数,可用于为不同模型检索模型权重。
模型类别 | 模型类型 | 模型权重函数 | 函数的作用 |
---|---|---|---|
监督式模型 | 线性回归和逻辑回归 | ML.WEIGHTS |
检索特征系数和拦截。 |
非监督式模型 | Kmeans | ML.CENTROIDS |
检索所有形心的特征系数。 |
矩阵因式分解 | ML.WEIGHTS |
检索所有潜在因子的权重。它们表示两个分解的矩阵,即用户矩阵和项矩阵。 | |
PCA | ML.PRINCIPAL_COMPONENTS |
检索所有主成分的特征系数,也称为特征向量。 | |
ML.PRINCIPAL_COMPONENT_INFO |
检索每个主成分的统计信息,例如特征值。 | ||
时序模型 | ARIMA_PLUS | ML.ARIMA_COEFFICIENTS |
检索 ARIMA 模型的系数,该模型用于为输入时序的趋势组件建模。如需了解其他组件(例如时序中存在的季节性模式),请使用 ML.ARIMA_EVALUATE 。 |
对于以下类型的模型,BigQuery ML 不支持模型权重函数:
如需查看除 AutoML Tables 模型外的所有这些模型类型的权重,请将模型从 BigQuery ML 导出到 Cloud Storage。然后,您可以使用 XGBoost 库直观呈现提升树和随机森林模型的树结构,或使用 TensorFlow 库直观呈现 DNN 以及 Wide & Deep 模型的图结构。目前,您无法获取 AutoML Tables 模型的模型权重信息。
如需详细了解如何导出模型,请参阅 EXPORT MODEL
语句和导出 BigQuery ML 模型以进行在线预测。