Présentation du prétraitement des caractéristiques
Le prétraitement des caractéristiques est l'une des étapes les plus importantes du cycle de vie du machine learning. Il s'agit de créer des caractéristiques et de nettoyer les données d'entraînement. La création de caractéristiques est également appelée ingénierie des caractéristiques.
BigQuery ML fournit les techniques de prétraitement de caractéristiques suivantes :
Prétraitement automatique. BigQuery ML effectue un prétraitement automatique pendant l'entraînement. Pour en savoir plus, consultez la page Prétraitement automatique des caractéristiques.
Prétraitement manuel. Vous pouvez utiliser la clause
TRANSFORM
dans l'instructionCREATE MODEL
pour définir un prétraitement personnalisé à l'aide de fonctions de prétraitement manuel. Vous pouvez également utiliser ces fonctions en dehors de la clauseTRANSFORM
pour traiter les données d'entraînement avant de créer le modèle.
Obtenir des informations sur les caractéristiques
Vous pouvez utiliser la fonction ML.FEATURE_INFO
pour récupérer les statistiques de toutes les colonnes de caractéristiques d'entrée.
Étapes suivantes
Découvrez la publication de caractéristiques dans BigQuery ML.