特徵預先處理總覽

特徵前處理是機器學習生命週期中最重要的步驟之一。包括建立特徵和清理訓練資料。建立特徵也稱為「特徵工程」

BigQuery ML 提供下列特徵前處理技術:

  • 自動預先處理。BigQuery ML 會在訓練期間自動執行前處理作業。詳情請參閱「自動特徵前處理」。

  • 手動預先處理。您可以在 CREATE MODEL 陳述式中使用 TRANSFORM 子句,透過手動前處理函式定義自訂前處理作業。您也可以在 TRANSFORM 子句之外使用這些函式,在建立模型前處理訓練資料。

取得功能資訊

您可以使用 ML.FEATURE_INFO 函式,擷取所有輸入特徵資料欄的統計資料。

您可以使用 CREATE MODEL 陳述式中的預設設定和推論函式,建立及使用 BigQuery ML 模型,即使沒有太多機器學習知識也能輕鬆上手。不過,如果具備機器學習開發生命週期的基本知識,例如特徵工程和模型訓練,有助於最佳化資料和模型,進而獲得更出色的結果。建議您使用下列資源,熟悉機器學習技術和程序:

後續步驟