Présentation de la création d'ensembles de données gérés sur Vertex AI

Vous pouvez utiliser un ensemble de données géré pour fournir les données source servant à entraîner les modèles AutoML et personnalisés sur Vertex AI. Un ensemble de données géré est requis pour AutoML et facultatif pour l'entraînement personnalisé.

Créer un ensemble de données géré pour les modèles AutoML

Vous pouvez créer des ensembles de données gérés pour l'entraînement de modèles AutoML à l'aide de la console Google Cloud ou de l'API Vertex AI. Les instructions pour y parvenir diffèrent légèrement suivant le type de données et l'objectif du modèle. Commencez par préparer vos données d'entraînement.

Image

Découvrez comment créer un ensemble de données géré pour les types de modèles d'images AutoML suivants :

Tabulaire

Découvrez comment créer un ensemble de données géré pour les types de modèles tabulaires AutoML suivants :

Texte

Découvrez comment créer un ensemble de données géré pour les types de modèles de texte AutoML suivants :

Vidéo

Découvrez comment créer un ensemble de données géré pour les types de modèles de vidéos AutoML suivants :

Créer un ensemble de données géré pour les modèles entraînés personnalisés

Les instructions de création d'un ensemble de données géré pour l'entraînement de modèles personnalisés sont identiques, quels que soient le type de données ou l'objectif du modèle.

Pour en savoir plus, consultez la page Utiliser des ensembles de données gérés.

Afficher les ensembles de données gérés à l'aide du service Data Catalog de Dataplex

Data Catalog est un service de gestion des métadonnées entièrement géré et évolutif dans Dataplex. Il fournit un emplacement centralisé pour rechercher des ensembles de données dans plusieurs projets et régions.

Pour en savoir plus, consultez Utiliser Data Catalog pour rechercher des ressources de modèles et d'ensembles de données.