Publication de caractéristiques
Ce document décrit les options permettant de rendre des fonctionnalités disponibles pour l'entraînement et l'inférence de modèles BigQuery ML. Pour toutes les options, vous devez enregistrer les fonctionnalités dans des tables BigQuery en tant que première étape préalable.
Exactitude à un moment précis
Les données utilisées pour entraîner un modèle comportent souvent des dépendances temporelles. Lorsque vous créez une table de caractéristiques contenant des caractéristiques soumises à des contraintes de temps, incluez une colonne de code temporel pour représenter les valeurs des caractéristiques telles qu'elles existaient à un moment donné pour chaque ligne. Vous pouvez ensuite employer des fonctions de recherche à un moment précis pour interroger des données issues de ces tables de caractéristiques afin de garantir l'absence de fuite de données entre l'entraînement et la diffusion. Ce processus permet l'exactitude à un moment précis.
Utilisez les fonctions suivantes pour spécifier des limites à un moment précis lors de la récupération de caractéristiques soumises à des contraintes de temps :
Diffuser des caractéristiques dans BigQuery ML
Pour entraîner des modèles et effectuer une inférence par lot dans BigQuery ML, vous pouvez récupérer des caractéristiques à l'aide de l'une des fonctions de recherche au moment donné décrites dans la section Exactitude à un moment précis. Vous pouvez inclure ces fonctions dans la clause query_statement
de l'instruction CREATE MODEL
pour l'entraînement, ou dans la clause query_statement
de la fonction à valeur de table appropriée, telle que ML.PREDICT
, pour la diffusion.
Diffuser des caractéristiques avec Vertex AI Feature Store
Pour diffuser des caractéristiques sur des modèles BigQuery ML enregistrés dans Vertex AI, vous pouvez utiliser Vertex AI Feature Store. Vertex AI Feature Store fonctionne sur les tables de caractéristiques dans BigQuery pour gérer et diffuser des caractéristiques avec une faible latence. Vous pouvez utiliser la diffusion en ligne pour récupérer des caractéristiques en temps réel pour la prédiction en ligne, et la diffusion hors connexion pour récupérer des caractéristiques pour l'entraînement de modèle.
Pour en savoir plus sur la préparation des données de caractéristiques BigQuery à utiliser dans Vertex AI Feature Store, consultez la page Préparer une source de données.