Les sections suivantes présentent le modèle de données Vertex AI Feature Store (ancien) et la terminologie utilisée pour décrire les ressources et les composants de Vertex AI Feature Store (ancien).
Modèle de données Vertex AI Feature Store (ancien)
Vertex AI Feature Store (ancien) utilise un modèle de données de séries temporelles pour stocker une série de valeurs pour les caractéristiques. Ce modèle permet à Vertex AI Feature Store (ancien) de conserver les valeurs de caractéristiques à mesure qu'elles changent au fil du temps. Vertex AI Feature Store (ancien) organise les ressources de manière hiérarchique dans l'ordre suivant : Featurestore -> EntityType -> Feature
. Vous devez créer ces ressources avant de pouvoir importer des données dans Vertex AI Feature Store (ancien).
Par exemple, supposons que vous disposiez des exemples de données source suivants issus d'une table BigQuery. Ces données source concernent les films et leurs caractéristiques.
Avant de pouvoir importer ces données dans Vertex AI Feature Store (ancien), vous devez créer un magasin de caractéristiques, qui est un conteneur de premier niveau pour toutes les autres ressources. Dans le featurestore, créez des types d'entité qui regroupent et contiennent des caractéristiques associées. Vous pouvez ensuite créer des caractéristiques qui correspondent aux caractéristiques de vos données sources. Les noms du type de l'entité et des caractéristiques peuvent correspondre aux noms des en-têtes de colonne, mais ce n'est pas obligatoire.
Dans cet exemple, l'en-tête de colonne movie_id
peut être mappé sur un type d'entité movie
. average_rating
, title
et genre
sont des caractéristiques du type d'entité movie
. Les valeurs de chaque colonne correspondent à des instances spécifiques d'un type d'entité ou d'une caractéristique, appelées entités et valeurs de caractéristiques.
La colonne d'horodatage indique la date à laquelle les valeurs des caractéristiques ont été générées. Dans le featurestore, les horodatages sont des attributs des valeurs de caractéristiques, et non un type de ressource distinct. Si toutes les valeurs de caractéristiques ont été générées en même temps, il n'est pas nécessaire de disposer d'une colonne d'horodatage. Vous pouvez spécifier le code temporel lors de votre requête d'importation.
Featurestore
Un featurestore est le conteneur de premier niveau pour les types d'entités, les caractéristiques et les valeurs de caractéristiques. En règle générale, une organisation crée un magasin de caractéristiques partagé pour l'importation, la publication et le partage des caractéristiques entre toutes les équipes de l'organisation. Toutefois, il peut parfois être nécessaire de créer plusieurs featurestores dans le même projet pour isoler les environnements. Par exemple, vous pouvez avoir des magasins de caractéristiques distincts pour l'expérimentation, le test et la production.
Type d'entité
Un type d'entité est un ensemble de caractéristiques présentant des relations sémantiques. Vous définissez vos propres types d'entités, en fonction des concepts pertinents pour votre cas d'utilisation. Par exemple, un service de cinéma peut avoir les types d'entités movie
et user
, qui regroupent les caractéristiques liées aux films ou aux clients.
Entité
Une entité est une instance d'un type d'entité. Par exemple, movie_01
et movie_02
sont des entités du type d'entité movie
. Dans un featurestore, chaque entité doit posséder un ID unique et être de type STRING
.
Caractéristique
Une caractéristique est une propriété ou un attribut mesurable d'un type d'entité. Par exemple, le type d'entité movie
possède des caractéristiques telles que average_rating
et title
, qui suivent diverses propriétés de films. Les caractéristiques sont associées à des types d'entités.
Les caractéristiques doivent être distinctes dans un type d'entité donné, mais elles ne doivent pas être uniques. Par exemple, si vous utilisez title
pour deux types d'entités différents, Vertex AI Feature Store (ancien) interprète title
comme deux caractéristiques différentes. Lors de la lecture des valeurs de caractéristique, vous fournissez la caractéristique et son type d'entité dans la requête.
Lorsque vous créez une caractéristique, vous spécifiez son type de valeur, par exemple BOOL_ARRAY
, DOUBLE
, DOUBLE_ARRAY
et STRING
. Cette valeur détermine les types de valeurs que vous pouvez importer pour une caractéristique particulière. Pour en savoir plus sur les types de valeurs acceptés, consultez la section valueType
dans la documentation de référence de l'API.
Valeur de la caractéristique
Vertex AI Feature Store (ancien) capture les valeurs d'une caractéristique à un moment spécifique. En d'autres termes, vous pouvez avoir plusieurs valeurs pour une entité et une caractéristique données. Par exemple, l'entité movie_01
peut avoir plusieurs valeurs de caractéristiques pour la caractéristique average_rating
. La valeur peut être 4.4
à un moment et 4.8
à une date ultérieure. Vertex AI Feature Store (ancien) associe un identifiant de tuple à chaque valeur de caractéristique (entity_id
, feature_id
, timestamp
) que Vertex AI Feature Store (ancien) utilise pour rechercher les valeurs au moment de la diffusion.
Vertex AI Feature Store (ancien) stocke les valeurs discrètes, même si le temps est continu. Lorsque vous demandez une valeur de caractéristique à l'instant t
, Vertex AI Feature Store (ancien) renvoie la dernière valeur stockée à l'instant t
ou avant. Par exemple, si Vertex AI Feature Store (ancien) stocke les informations de localisation d'une voiture aux instants 100
et 110
, l'emplacement à l'instant 100
est utilisé pour les requêtes effectuées à tout moment entre 100
(inclusif) et 110
(exclusif). Si vous avez besoin d'une résolution plus élevée, vous pouvez, par exemple, déduire l'emplacement entre les valeurs ou augmenter le taux d'échantillonnage de vos données.
Importation de caractéristiques
L'importation de caractéristiques correspond à l'importation des valeurs des caractéristiques calculées par les jobs d'extraction dans un magasin de caractéristiques. Pour pouvoir importer des données, vous devez tout d'abord définir le type d'entité et les caractéristiques correspondantes dans le magasin de caractéristiques. Vertex AI Feature Store (ancien) propose des fonctionnalités d'importation par lot et par flux continu, qui vous permettent d'ajouter des valeurs de caractéristiques de manière groupée ou en temps réel.
Par exemple, vous avez peut-être traité des données sources résidant dans des emplacements tels que BigQuery ou Cloud Storage. Vous pouvez importer des données de manière groupée à partir de ces sources dans un magasin de caractéristiques central afin que ces valeurs puissent être publiées dans un format uniforme. À mesure que vos données sources changent, vous pouvez utiliser l'importation en flux continu pour obtenir rapidement ces modifications dans votre magasin de caractéristiques. De cette façon, vous disposez des données les plus récentes pour les scénarios de diffusion en ligne.
Pour en savoir plus, consultez les sections Importer des valeurs de caractéristiques par lot ou Importer en flux continu.
Publication de caractéristiques
La diffusion de caractéristiques consiste à exporter des valeurs de caractéristiques stockées à des fins d'entraînement ou d'inférence. Vertex AI Feature Store (ancien) propose deux méthodes de diffusion des caractéristiques : par lot et en ligne. La diffusion par lots est destinée à un débit élevé et à diffuser de grands volumes de données pour un traitement hors connexion (par exemple pour l'entraînement de modèle ou les prédictions par lots). La diffusion en ligne est destinée à la récupération des données à faible latence de petits lots de données à des fins de traitement en temps réel (comme pour les prédictions en ligne).
Pour en savoir plus, consultez la section concernant la diffusion en ligne ou par lot.
Vue des entités
Lorsque vous récupérez des valeurs d'un featurestore, le service renvoie une vue d'entité contenant les valeurs des caractéristiques que vous avez demandées. Vous pouvez considérer une vue d'entité comme une projection des caractéristiques et des valeurs renvoyées par Vertex AI Feature Store (ancien) à partir d'une requête de diffusion en ligne ou par lot :
- Pour les requêtes de diffusion en ligne, vous pouvez obtenir tout ou partie d'un ensemble de caractéristiques pour un type d'entité particulier.
- Pour les requêtes de diffusion par lot, vous pouvez obtenir la totalité ou un sous-ensemble de caractéristiques pour un ou plusieurs types d'entités. Par exemple, si les caractéristiques sont réparties sur plusieurs types d'entités, vous pouvez les récupérer en une seule requête qui combine ces caractéristiques. Vous pouvez ensuite utiliser les résultats pour alimenter une requête de machine learning ou de prédiction par lot.
Exporter les données
Vertex AI Feature Store (ancien) vous permet d'exporter des données de vos magasins de caractéristiques afin de pouvoir sauvegarder et archiver les valeurs des caractéristiques. Vous pouvez choisir d'exporter les dernières valeurs des caractéristiques (instantané) ou une plage de valeurs (exportation complète). Pour en savoir plus, consultez la page Exporter les valeurs des caractéristiques.
Étapes suivantes
- Découvrez comment configurer votre projet pour Vertex AI Feature Store (ancien).
- Découvrez les exigences concernant les données sources.