BigQuery ML 模型權重總覽

本文說明 BigQuery ML 如何支援機器學習 (ML) 模型的模型權重探索功能。

機器學習模型是一種構件,在訓練資料上執行機器學習演算法後會儲存下來。模型代表預測所需的規則、數字和任何其他演算法專屬資料結構。以下提供幾個範例:

  • 線性迴歸模型是由具有特定值的係數向量組成。
  • 決策樹模型是由一或多個樹狀結構的 if-then 陳述式組成,這些陳述式具有特定值。
  • 深層類神經網路模型是由圖形結構組成,其中包含特定值的權重向量或矩陣。

在 BigQuery ML 中,「模型權重」一詞用於描述模型所包含的元件。

BigQuery ML 中的模型權重供應項目

BigQuery ML 提供多種函式,可用於擷取不同模型的模型權重。

模型類別 模型類型 模型權重函式 函式用途
受監護裝置 線性與邏輯迴歸 ML.WEIGHTS 擷取特徵係數和截距。
非監督式模型 Kmeans ML.CENTROIDS 擷取所有群集中心的特徵係數。
矩陣分解 ML.WEIGHTS 擷取所有潛在因子的權重。這兩個矩陣代表分解後的矩陣,也就是使用者矩陣和項目矩陣。
PCA ML.PRINCIPAL_COMPONENTS 擷取所有主成分的特徵係數,又稱為特徵向量。
ML.PRINCIPAL_COMPONENT_INFO 擷取每個主成分的統計資料,例如特徵值。
時間序列模型 ARIMA_PLUS ML.ARIMA_COEFFICIENTS 擷取 ARIMA 模型的係數,用於模擬輸入時間序列的趨勢成分。如要瞭解其他元件 (例如時間序列中的季節性模式),請使用 ML.ARIMA_EVALUATE

BigQuery ML 不支援下列模型類型的模型權重函式:

如要查看所有模型類型的權重 (AutoML Tables 模型除外),請將模型從 BigQuery ML 匯出至 Cloud Storage。接著,您可以使用 XGBoost 程式庫,將提升樹狀結構和隨機森林模型的樹狀結構視覺化,也可以使用 TensorFlow 程式庫,將 DNN 和寬而深模型的圖形結構視覺化。AutoML Tables 模型沒有取得模型權重資訊的方法。

如要進一步瞭解如何匯出模型,請參閱EXPORT MODEL 陳述式和「匯出 BigQuery ML 模型以進行線上預測」。

後續步驟

如要進一步瞭解 ML 模型支援的 SQL 陳述式和函式,請參閱ML 模型端對端使用者歷程