支持的输入特征类型
BigQuery ML 支持针对不同的模型类型使用不同的输入特征类型。下表列出了支持的输入特征类型:
模型类别 | 模型类型 | 数值类型(INT64、NUMERIC、BIGNUMERIC、FLOAT64) | 分类类型(BOOL、STRING、BYTES、DATE、DATETIME) | TIMESTAMP | STRUCT | GEOGRAPHY | ARRAY<数值类型> | ARRAY<分类类型> | ARRAY<STRUCT<INT64、数值类型>> |
---|---|---|---|---|---|---|---|---|---|
监督式学习 | 线性回归和逻辑回归 | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ | |
深度神经网络 | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ | |||
Wide & Deep | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ | |||
提升树 | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ | |||
AutoML Tables | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ | |||
非监督式学习 | K-means | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ | |
PCA | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ | |||
自动编码器 | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ | ||
时序模型 | ARIMA_PLUS_XREG | ✔ | ✔ | ✔ | ✔ | ✔ | ✔ |
密集矢量输入
在模型训练期间,BigQuery ML 支持使用 ARRAY<numerical>
作为密集矢量输入。嵌入特征是一种特殊类型的密集矢量。如需了解详情,请参阅 ML.GENERATE_EMBEDDING
函数。
稀疏输入
BigQuery ML 支持在模型训练期间使用 ARRAY<STRUCT>
作为稀疏输入。每个结构体包含一个 INT64
值(表示从零开始的索引)和一个数字类型(表示相应值)。
以下是整数数组的稀疏张量输入示例:[0,1,0,0,0,0,1]
ARRAY<STRUCT<k INT64, v INT64>>[(1, 1), (6, 1)] AS f1