BigQuery ML 模型权重概览

本文档介绍了 BigQuery ML 如何支持机器学习 (ML) 模型的模型权重可检测性。

机器学习模型是在对训练数据运行机器学习算法后保存的工件。该模型表示进行预测所需的规则、数字和任何其他特定于算法的数据结构。下面是一些示例:

  • 线性回归模型由具有特定值的系数矢量组成。
  • 决策树模型由一个或多个具有特定值的 if-then 语句树组成。
  • 深度神经网络模型由具有特定值的权重矢量或矩阵的图结构组成。

在 BigQuery ML 中,模型权重用于描述组成模型的组件。

如需了解每种模型类型支持的 SQL 语句和函数,请参阅每个模型的端到端用户体验历程

BigQuery ML 中的模型权重产品

BigQuery ML 提供了多种函数,可用于为不同模型检索模型权重。

模型类别 模型类型 模型权重函数 函数的作用
监督式模型 线性回归和逻辑回归 ML.WEIGHTS 检索特征系数和拦截。
非监督式模型 Kmeans ML.CENTROIDS 检索所有形心的特征系数。
矩阵因式分解 ML.WEIGHTS 检索所有潜在因子的权重。它们表示两个分解的矩阵,即用户矩阵和项矩阵。
PCA ML.PRINCIPAL_COMPONENTS 检索所有主成分的特征系数,也称为特征向量。
ML.PRINCIPAL_COMPONENT_INFO 检索每个主成分的统计信息,例如特征值。
时序模型 ARIMA_PLUS ML.ARIMA_COEFFICIENTS 检索 ARIMA 模型的系数,该模型用于为输入时序的趋势组件建模。如需了解其他组件(例如时序中存在的季节性模式),请使用 ML.ARIMA_EVALUATE

对于以下类型的模型,BigQuery ML 不支持模型权重函数:

如需查看除 AutoML Tables 模型外的所有这些模型类型的权重,请将模型从 BigQuery ML 导出到 Cloud Storage。然后,您可以使用 XGBoost 库直观呈现提升树和随机森林模型的树结构,或使用 TensorFlow 库直观呈现 DNN 以及 Wide & Deep 模型的图结构。目前,您无法获取 AutoML Tables 模型的模型权重信息。

如需详细了解如何导出模型,请参阅 EXPORT MODEL 语句导出 BigQuery ML 模型以进行在线预测