Données textuelles Hello : créer un ensemble de données de classification de texte et importer des documents

Utilisez la console Vertex AI pour créer un ensemble de données de classification de texte. Une fois votre ensemble de données créé, utilisez le fichier CSV que vous avez copié dans votre bucket Cloud Storage pour importer ces documents dans l'ensemble de données.

Ce tutoriel comporte plusieurs pages :

Configurer votre projet et votre environnement.
Créer un ensemble de données de classification de texte.
Entraîner un modèle de classification de texte AutoML.
Déployer le modèle sur un point de terminaison et effectuer une prédiction.
Nettoyer votre projet.

Chaque page suppose que vous avez déjà effectué les instructions des pages précédentes du tutoriel.

Accédez à la console Vertex AI.
Sur la page Premiers pas avec l'IA Vertex, cliquez sur Créer un ensemble de données.
Spécifiez les détails de votre ensemble de données.
1. Spécifiez un nom pour cet ensemble de données, comme par exemple text_classification_tutorial.
2. Dans la section Sélectionner un type de données et un objectif, cliquez sur Texte, puis sélectionnez Classification de texte (étiquette unique).
3. Pour la région, sélectionnez us-central1.
  
  Ce tutoriel utilise us-central1, mais Vertex AI est compatible avec d'autres régions, telles que europe-west4.
4. Cliquez sur Créer pour créer l'ensemble de données vide et importez ensuite des documents.
Sur la page d'importation, sélectionnez Sélectionner des fichiers d'importation depuis Cloud Storage , puis spécifiez l'emplacement Cloud Storage de votre fichier CSV. Conseil: Cliquez sur Browse (Parcourir), sélectionnez le fichier happiness.csv dans la boîte de dialogue Select Object (Sélectionner un objet), puis cliquez sur Select (Sélectionner).

Le fichier CSV utilisé dans ce tutoriel se situe à l'emplacement : gs://${BUCKET}/text/happiness.csv. Le bucket de ce tutoriel se trouve dans la même région que l'ensemble de données mais vous pouvez spécifier des fichiers qui se trouvent dans des buckets de n'importe quelle région.
Conservez la répartition des données par défaut.

Vertex AI attribue automatiquement des documents aux ensembles d'entraînement, de validation et de test. Pour en savoir plus, consultez la page À propos des divisions de données pour les modèles AutoML.
Cliquez sur Continuer pour lancer l'importation.

Le processus d'importation prend quelques minutes. Une fois l'importation terminée, vous pouvez parcourir tous les documents importés et les étiquettes associées dans l'onglet Parcourir de l'ensemble de données.

Étape suivante

Suivez la page suivante de ce tutoriel pour démarrer une tâche d'entraînement de modèle AutoML.

Configurer votre projet et votre environnement

Entraîner un modèle de classification de texte AutoML