Présentation du prétraitement des caractéristiques

Le prétraitement des caractéristiques est l'une des étapes les plus importantes du cycle de vie du machine learning. Il s'agit de créer des caractéristiques et de nettoyer les données d'entraînement. La création de caractéristiques est également appelée extraction de caractéristiques.

BigQuery ML fournit les techniques de prétraitement de caractéristiques suivantes :

  • Prétraitement automatique. BigQuery ML effectue un prétraitement automatique pendant l'entraînement. Pour en savoir plus, consultez la page Prétraitement automatique des caractéristiques.

  • Prétraitement manuel. Vous pouvez utiliser la clause TRANSFORM dans l'instruction CREATE MODEL pour définir un prétraitement personnalisé à l'aide de fonctions de prétraitement manuel. Vous pouvez également utiliser ces fonctions en dehors de la clause TRANSFORM pour traiter les données d'entraînement avant de créer le modèle.

Obtenir des informations sur les caractéristiques

Vous pouvez utiliser la fonction ML.FEATURE_INFO pour récupérer les statistiques de toutes les colonnes de caractéristiques d'entrée.

Étapes suivantes

Découvrez la publication de caractéristiques dans BigQuery ML.