特徵預先處理總覽
特徵前處理是機器學習生命週期中最重要的步驟之一。包括建立特徵和清理訓練資料。建立特徵也稱為「特徵工程」。
BigQuery ML 提供下列特徵前處理技術:
自動預先處理。BigQuery ML 會在訓練期間自動執行前處理作業。詳情請參閱「自動特徵前處理」。
手動預先處理。您可以在
CREATE MODEL
陳述式中使用TRANSFORM
子句,透過手動前處理函式定義自訂前處理作業。您也可以在TRANSFORM
子句之外使用這些函式,在建立模型前處理訓練資料。
取得功能資訊
您可以使用 ML.FEATURE_INFO
函式,擷取所有輸入特徵資料欄的統計資料。
建議的知識
您可以使用 CREATE MODEL
陳述式中的預設設定和推論函式,建立及使用 BigQuery ML 模型,即使沒有太多機器學習知識也能輕鬆上手。不過,如果具備機器學習開發生命週期的基本知識,例如特徵工程和模型訓練,有助於最佳化資料和模型,進而獲得更出色的結果。建議您使用下列資源,熟悉機器學習技術和程序:
後續步驟
- 瞭解 BigQuery ML 中的特徵服務。
如要進一步瞭解支援特徵預先處理的模型的支援 SQL 陳述式和函式,請參閱下列文件: