Cette page a été traduite par l'API Cloud Translation.

Données textuelles Hello : créer un ensemble de données de classification de texte et importer des documents

Sur cette page
Étape suivante

À partir du 15 septembre 2024, vous ne pourrez personnaliser les objectifs de classification, d'extraction d'entités et d'analyse des sentiments qu'en passant aux requêtes et à l'ajustement Vertex AI Gemini. L'entraînement ou la mise à jour des modèles pour les objectifs de classification de texte, d'extraction d'entités et d'analyse des sentiments de Vertex AI AutoML ne seront plus disponibles. Vous pouvez continuer à utiliser les modèles Vertex AI AutoML Text existants jusqu'au 15 juin 2025. Pour obtenir une comparaison du texte AutoML et Gemini, consultez la page Gemini pour les utilisateurs de texte AutoML. Pour en savoir plus sur la façon dont Gemini offre une expérience utilisateur améliorée grâce à des fonctionnalités de requêtes améliorées, consultez Présentation du réglage. Pour commencer à utiliser le réglage, consultez la page Réglage des modèles pour les modèles textuels Gemini

Utilisez la console Vertex AI pour créer un ensemble de données de classification de texte. Une fois votre ensemble de données créé, utilisez le fichier CSV que vous avez copié dans votre bucket Cloud Storage pour importer ces documents dans l'ensemble de données.

Ce tutoriel comporte plusieurs pages :

Configurer votre projet et votre environnement.
Créer un ensemble de données de classification de texte.
Entraîner un modèle de classification de texte AutoML.
Déployer le modèle sur un point de terminaison et effectuer une prédiction.
Nettoyer votre projet.

Chaque page suppose que vous avez déjà effectué les instructions des pages précédentes du tutoriel.

Accédez à la console Vertex AI.
Sur la page Premiers pas avec l'IA Vertex, cliquez sur Créer un ensemble de données.
Spécifiez les détails de votre ensemble de données.
1. Spécifiez un nom pour cet ensemble de données, comme par exemple text_classification_tutorial.
2. Dans la section Sélectionner un type de données et un objectif, cliquez sur Texte, puis sélectionnez Classification de texte (étiquette unique).
3. Pour la région, sélectionnez us-central1.
  
  Ce tutoriel utilise us-central1, mais Vertex AI est compatible avec d'autres régions, telles que europe-west4.
4. Cliquez sur Créer pour créer l'ensemble de données vide et importez ensuite des documents.
Sur la page d'importation, sélectionnez Sélectionner des fichiers d'importation depuis Cloud Storage , puis spécifiez l'emplacement Cloud Storage de votre fichier CSV. Conseil: Cliquez sur Browse (Parcourir), sélectionnez le fichier happiness.csv dans la boîte de dialogue Select Object (Sélectionner un objet), puis cliquez sur Select (Sélectionner).

Le fichier CSV utilisé dans ce tutoriel se situe à l'emplacement : gs://${BUCKET}/text/happiness.csv. Le bucket de ce tutoriel se trouve dans la même région que l'ensemble de données mais vous pouvez spécifier des fichiers qui se trouvent dans des buckets de n'importe quelle région.
Conservez la répartition des données par défaut.

Vertex AI attribue automatiquement des documents aux ensembles d'entraînement, de validation et de test. Pour en savoir plus, consultez la page À propos des divisions de données pour les modèles AutoML.
Cliquez sur Continuer pour lancer l'importation.

Le processus d'importation prend quelques minutes. Une fois l'importation terminée, vous pouvez parcourir tous les documents importés et les étiquettes associées dans l'onglet Parcourir de l'ensemble de données.

Étape suivante

Suivez la page suivante de ce tutoriel pour démarrer une tâche d'entraînement de modèle AutoML.

Configurer votre projet et votre environnement

Entraîner un modèle de classification de texte AutoML