Présentation de Vertex Feature Store

Vertex Feature Store (Feature Store) fournit un dépôt centralisé pour l'organisation, le stockage et la diffusion des caractéristiques de ML. En utilisant un featurestore central, votre organisation peut partager, découvrir et réutiliser efficacement des fonctionnalités de ML à grande échelle, ce qui peut augmenter la vitesse de votre organisation pour le développement et le déploiement de nouvelles applications de ML. Feature Store est une solution entièrement gérée. Il gère et fait évoluer l'infrastructure sous-jacente, comme les ressources de stockage et de calcul. Cette solution signifie que vos data scientists peuvent se concentrer sur la logique de calcul des caractéristiques, au lieu de s'inquiéter des difficultés liées au déploiement des caractéristiques en production.

Feature Store est une fonctionnalité intégrée de Vertex AI. Vous pouvez utiliser Feature Store de manière indépendante ou avec les workflows de Vertex AI. Par exemple, vous pouvez récupérer des données de Feature Store pour entraîner des modèles personnalisés ou AutoML dans Vertex AI.

Présentation

Utilisez Feature Store pour créer et gérer des ressources, telles qu'un featurestore. Un featurestore est un conteneur de premier niveau pour vos caractéristiques et leurs valeurs. Dès que vous configurez un featurestore, les utilisateurs autorisés peuvent ajouter et partager leurs fonctionnalités sans assistance technique supplémentaire. Les utilisateurs peuvent définir des caractéristiques, puis ingérer (importer) des valeurs de caractéristiques à partir de différentes sources de données.

Tout utilisateur autorisé peut rechercher et récupérer des valeurs à partir du featurestore. Par exemple, les utilisateurs peuvent découvrir des fonctionnalités, puis effectuer une exportation par lots afin d'obtenir des données d'entraînement pour la création de modèles de ML. Les utilisateurs peuvent également récupérer des valeurs de caractéristiques en temps réel pour effectuer des prédictions en ligne rapidement.

Avantages

Avant d'utiliser Feature Store, vous auriez peut-être calculé des valeurs de caractéristiques et les auriez enregistrées à différents emplacements, tels que des tables dans BigQuery ou des fichiers dans Cloud Storage. De plus, vous auriez peut-être créé et géré des solutions distinctes pour le stockage et la consommation de valeurs de caractéristiques. En revanche, Feature Store fournit une solution unifiée pour le stockage par lots et en ligne, ainsi que la diffusion de caractéristiques de ML. Les sections suivantes détaillent les avantages offerts par Feature Store.

Partager des fonctionnalités dans l'ensemble de votre organisation

Si vous produisez des caractéristiques dans un featurestore, vous pouvez rapidement les partager avec d'autres utilisateurs à des fins d'entraînement ou de diffusion. Les équipes n'ont pas besoin de repenser l'ingénierie de fonctionnalités pour différents projets ou cas d'utilisation. De plus, comme vous pouvez gérer et diffuser des fonctionnalités à partir d'un dépôt central, cela garantit la cohérence au sein de votre organisation et réduit les tâches en double, en particulier pour les fonctionnalités à forte valeur.

Feature Store offre des fonctions de recherche et de filtrage qui permettent aux autres utilisateurs de découvrir et de réutiliser facilement les fonctionnalités existantes. Pour chaque fonctionnalité, les utilisateurs peuvent consulter les métadonnées pertinentes pour déterminer la qualité et les modèles d'utilisation de la fonctionnalité. Par exemple, les utilisateurs peuvent afficher la fraction des entités ayant une valeur valide pour une caractéristique (également appelée couverture de caractéristique), la distribution statistique des valeurs de caractéristiques et la fréquence des mises à jour des caractéristiques.

Solution gérée pour une diffusion en ligne à grande échelle

Feature Store fournit une solution gérée pour la diffusion de caractéristiques en ligne (diffusion à faible latence), ce qui est essentiel pour réaliser des prédictions en ligne en temps opportun. Il n'est pas nécessaire de créer ni d'exploiter une infrastructure de diffusion de données à faible latence. Feature Store effectue cette opération à votre place et évolue selon vos besoins. Vous codez la logique pour générer des caractéristiques, mais déchargez la tâche de diffusion des caractéristiques. Tout cela, y compris la gestion, simplifie la création de nouvelles fonctionnalités pour permettre aux data scientists de travailler sans se soucier du déploiement.

Atténuer le décalage entraînement/diffusion

Un décalage entraînement/diffusion se produit lorsque la distribution des données de caractéristiques que vous utilisez en production diffère de la distribution des données de caractéristiques qui a été utilisée pour entraîner votre modèle. Ce décalage entraîne souvent des écarts entre les performances d'un modèle pendant l'entraînement et ses performances en production. Les exemples suivants montrent comment Feature Store peut traiter les sources potentielles de décalage entraînement/diffusion :

  • Feature Store garantit qu'une valeur de caractéristique est ingérée une fois dans un featurestore et qu'elle est réutilisée à la fois pour l'entraînement et la diffusion. Sans featurestore, vous pouvez disposer de chemins de code différents pour générer des caractéristiques entre l'entraînement et la diffusion. Par conséquent, les valeurs de caractéristiques peuvent différer pour l'entraînement et la diffusion.
  • Feature Store fournit des recherches à un moment précis pour extraire les données de l'historique pour l'entraînement. Avec ces recherches, vous ne pouvez extraire que les valeurs de caractéristiques disponibles avant une prédiction, et non après, ce qui permet de réduire les risques de fuite de données.

Quotas et limites

Feature Store applique des quotas et des limites afin de vous aider à gérer les ressources en définissant vos propres limites d'utilisation et de protéger la communauté des utilisateurs de Google Cloud en empêchant les pics d'utilisation imprévus. Pour vous éviter de rencontrer des contraintes non planifiées, consultez les quotas de la fonctionnalité Feature Store sur la page Quotas et limites. Par exemple, le magasin de caractéristiques définit un quota sur le nombre de nœuds de diffusion en ligne et un quota sur le nombre de requêtes de diffusion en ligne que vous pouvez effectuer par minute.

Étape suivante