Restez organisé à l'aide des collections
Enregistrez et classez les contenus selon vos préférences.
Présentation du prétraitement des caractéristiques
Le prétraitement des caractéristiques est l'une des étapes les plus importantes du cycle de vie du machine learning. Il s'agit de créer des caractéristiques et de nettoyer les données d'entraînement. La création de caractéristiques est également appelée ingénierie des caractéristiques.
BigQuery ML fournit les techniques de prétraitement de caractéristiques suivantes :
Prétraitement automatique. BigQuery ML effectue un prétraitement automatique pendant l'entraînement. Pour en savoir plus, consultez la page Prétraitement automatique des caractéristiques.
Prétraitement manuel. Vous pouvez utiliser la clause TRANSFORM dans l'instruction CREATE MODEL pour définir un prétraitement personnalisé à l'aide de fonctions de prétraitement manuel.
Vous pouvez également utiliser ces fonctions en dehors de la clause TRANSFORM pour traiter les données d'entraînement avant de créer le modèle.
Obtenir des informations sur les caractéristiques
Vous pouvez utiliser la fonction ML.FEATURE_INFO pour récupérer les statistiques de toutes les colonnes de caractéristiques d'entrée.
Connaissances recommandées
En utilisant les paramètres par défaut dans les instructions CREATE MODEL et les fonctions d'inférence, vous pouvez créer et utiliser des modèles BigQuery ML même si vous n'avez pas beaucoup de connaissances en ML. Toutefois, des connaissances de base sur le cycle de vie du développement du ML, comme l'extraction de caractéristiques et l'entraînement des modèles, vous aident à optimiser à la fois vos données et votre modèle pour obtenir de meilleurs résultats. Nous vous recommandons d'utiliser les ressources suivantes pour vous familiariser avec les techniques et les processus de ML :
Sauf indication contraire, le contenu de cette page est régi par une licence Creative Commons Attribution 4.0, et les échantillons de code sont régis par une licence Apache 2.0. Pour en savoir plus, consultez les Règles du site Google Developers. Java est une marque déposée d'Oracle et/ou de ses sociétés affiliées.
Dernière mise à jour le 2025/09/04 (UTC).
[[["Facile à comprendre","easyToUnderstand","thumb-up"],["J'ai pu résoudre mon problème","solvedMyProblem","thumb-up"],["Autre","otherUp","thumb-up"]],[["Difficile à comprendre","hardToUnderstand","thumb-down"],["Informations ou exemple de code incorrects","incorrectInformationOrSampleCode","thumb-down"],["Il n'y a pas l'information/les exemples dont j'ai besoin","missingTheInformationSamplesINeed","thumb-down"],["Problème de traduction","translationIssue","thumb-down"],["Autre","otherDown","thumb-down"]],["Dernière mise à jour le 2025/09/04 (UTC)."],[[["\u003cp\u003eFeature preprocessing, encompassing both feature creation (engineering) and data cleaning, is a crucial step in the machine learning process.\u003c/p\u003e\n"],["\u003cp\u003eBigQuery ML offers automatic preprocessing during training, simplifying the process for users.\u003c/p\u003e\n"],["\u003cp\u003eManual preprocessing is also available in BigQuery ML, allowing for custom preprocessing definitions using the \u003ccode\u003eTRANSFORM\u003c/code\u003e clause and specific functions.\u003c/p\u003e\n"],["\u003cp\u003eThe \u003ccode\u003eML.FEATURE_INFO\u003c/code\u003e function enables users to retrieve statistics about the input feature columns.\u003c/p\u003e\n"],["\u003cp\u003eBasic knowledge of the ML development lifecycle, including feature engineering and model training, is recommended for better optimization of data and models.\u003c/p\u003e\n"]]],[],null,["# Feature preprocessing overview\n==============================\n\n*Feature preprocessing* is one of the most important steps in the machine\nlearning lifecycle. It consists of creating features and cleaning the training\ndata. Creating features is also referred as *feature engineering*.\n\nBigQuery ML provides the following feature preprocessing techniques:\n\n- **Automatic preprocessing** . BigQuery ML performs automatic\n preprocessing during training. For more information, see [Automatic feature\n preprocessing](/bigquery/docs/reference/standard-sql/bigqueryml-auto-preprocessing).\n\n- **Manual preprocessing** . You can use the [`TRANSFORM` clause](/bigquery/docs/reference/standard-sql/bigqueryml-syntax-create#transform)\n in the `CREATE MODEL` statement to define custom preprocessing using [manual\n preprocessing\n functions](/bigquery/docs/manual-preprocessing#types_of_preprocessing_functions).\n You can also use these functions outside of the `TRANSFORM` clause to\n process training data before creating the model.\n\nGet feature information\n-----------------------\n\nYou can use the [`ML.FEATURE_INFO`\nfunction](/bigquery/docs/reference/standard-sql/bigqueryml-syntax-feature) to\nretrieve the statistics of all input feature columns.\n\nRecommended knowledge\n---------------------\n\nBy using the default settings in the `CREATE MODEL` statements and the\ninference functions, you can create and use BigQuery ML models\neven without much ML knowledge. However, having basic knowledge about the\nML development lifecycle, such as feature engineering and model training,\nhelps you optimize both your data and your model to\ndeliver better results. We recommend using the following resources to develop\nfamiliarity with ML techniques and processes:\n\n- [Machine Learning Crash Course](https://developers.google.com/machine-learning/crash-course)\n- [Intro to Machine Learning](https://www.kaggle.com/learn/intro-to-machine-learning)\n- [Data Cleaning](https://www.kaggle.com/learn/data-cleaning)\n- [Feature Engineering](https://www.kaggle.com/learn/feature-engineering)\n- [Intermediate Machine Learning](https://www.kaggle.com/learn/intermediate-machine-learning)\n\nWhat's next\n-----------\n\nLearn about [feature serving](/bigquery/docs/feature-serving) in\nBigQuery ML."]]