Données de texte Hello : configurer votre projet et votre environnement

Ce tutoriel explique comment créer un modèle pour classer des contenus à l'aide de Vertex AI. Ce tutoriel entraîne un modèle AutoML à l'aide d'un corpus de "moments de bonheur" vécus par des utilisateurs, issu de l'ensemble de données Open Source HappyDB de Kaggle. Le modèle qui en résulte classe les moments heureux en catégories qui reflètent les causes du bonheur.

Dans cette partie du tutoriel, vous allez configurer votre projet Google Cloud pour qu'il utilise Vertex AI et un bucket Cloud Storage contenant les documents nécessaires à l'entraînement de votre modèle AutoML.

Ce tutoriel comporte plusieurs pages :

  1. Configurer votre projet et votre environnement.

  2. Créer un ensemble de données de classification de texte.

  3. Entraîner un modèle de classification de texte AutoML.

  4. Déployer le modèle sur un point de terminaison et effectuer une prédiction.

  5. Nettoyer votre projet.

Chaque page suppose que vous avez déjà effectué les instructions des pages précédentes du tutoriel.

Configurer votre projet

Tout au long de ce tutoriel, utilisez Google Cloud Console pour interagir avec Google Cloud. Suivez les étapes ci-dessous avant d'utiliser la fonctionnalité Vertex AI.

  1. Connectez-vous à votre compte Google Cloud. Si vous débutez sur Google Cloud, créez un compte pour évaluer les performances de nos produits en conditions réelles. Les nouveaux clients bénéficient également de 300 $ de crédits gratuits pour exécuter, tester et déployer des charges de travail.
  2. Dans Google Cloud Console, sur la page de sélection du projet, sélectionnez ou créez un projet Google Cloud.

    Accéder au sélecteur de projet

  3. Assurez-vous que la facturation est activée pour votre projet Cloud. Découvrez comment vérifier que la facturation est activée pour votre projet.

  4. Activez l'API Vertex AI.

    Activer l'API

  5. Créez un compte de service :

    1. Dans Cloud Console, accédez à la page Créer un compte de service.

      Accéder à la page "Créer un compte de service"
    2. Sélectionnez un projet.
    3. Dans le champ Nom du compte de service, saisissez un nom. Cloud Console remplit le champ ID du compte de service en fonction de ce nom.

      Dans le champ Description du compte de service, saisissez une description. Exemple : Service account for quickstart.

    4. Cliquez sur Créer et continuer.
    5. Cliquez sur le champ Sélectionner un rôle.

      Dans la section Accès rapide, cliquez sur Basique, puis sur Propriétaire.

    6. Cliquez sur Continuer.
    7. Cliquez sur OK pour terminer la création du compte de service.

      Ne fermez pas la fenêtre de votre navigateur. Vous en aurez besoin lors de la tâche suivante.

  6. Créez une clé de compte de service :

    1. Dans Cloud Console, cliquez sur l'adresse e-mail du compte de service que vous avez créé.
    2. Cliquez sur Clés.
    3. Cliquez sur Add key (Ajouter une clé), puis sur Create new key (Créer une clé).
    4. Cliquez sur Create (Créer). Un fichier de clé JSON est téléchargé sur votre ordinateur.
    5. Cliquez sur Close (Fermer).
  7. Définissez la variable d'environnement GOOGLE_APPLICATION_CREDENTIALS pour qu'elle pointe vers le chemin du fichier JSON contenant la clé de votre compte de service. Cette variable ne s'applique qu'à la session de shell actuelle. Par conséquent, si vous ouvrez une nouvelle session, vous devez de nouveau la définir.

  8. Dans Google Cloud Console, sur la page de sélection du projet, sélectionnez ou créez un projet Google Cloud.

    Accéder au sélecteur de projet

  9. Assurez-vous que la facturation est activée pour votre projet Cloud. Découvrez comment vérifier que la facturation est activée pour votre projet.

  10. Activez l'API Vertex AI.

    Activer l'API

  11. Créez un compte de service :

    1. Dans Cloud Console, accédez à la page Créer un compte de service.

      Accéder à la page "Créer un compte de service"
    2. Sélectionnez un projet.
    3. Dans le champ Nom du compte de service, saisissez un nom. Cloud Console remplit le champ ID du compte de service en fonction de ce nom.

      Dans le champ Description du compte de service, saisissez une description. Exemple : Service account for quickstart.

    4. Cliquez sur Créer et continuer.
    5. Cliquez sur le champ Sélectionner un rôle.

      Dans la section Accès rapide, cliquez sur Basique, puis sur Propriétaire.

    6. Cliquez sur Continuer.
    7. Cliquez sur OK pour terminer la création du compte de service.

      Ne fermez pas la fenêtre de votre navigateur. Vous en aurez besoin lors de la tâche suivante.

  12. Créez une clé de compte de service :

    1. Dans Cloud Console, cliquez sur l'adresse e-mail du compte de service que vous avez créé.
    2. Cliquez sur Clés.
    3. Cliquez sur Add key (Ajouter une clé), puis sur Create new key (Créer une clé).
    4. Cliquez sur Create (Créer). Un fichier de clé JSON est téléchargé sur votre ordinateur.
    5. Cliquez sur Close (Fermer).
  13. Définissez la variable d'environnement GOOGLE_APPLICATION_CREDENTIALS pour qu'elle pointe vers le chemin du fichier JSON contenant la clé de votre compte de service. Cette variable ne s'applique qu'à la session de shell actuelle. Par conséquent, si vous ouvrez une nouvelle session, vous devez de nouveau la définir.

  14. Dans Cloud Console, activez Cloud Shell.

    Activer Cloud Shell

    En bas de la fenêtre de Cloud Console, une session Cloud Shell démarre et affiche une invite de ligne de commande. Cloud Shell est un environnement shell dans lequel le SDK Cloud est déjà installé (y compris l'outil de ligne de commande gcloud), et dans lequel des valeurs sont déjà définies pour votre projet actuel. L'initialisation de la session peut prendre quelques secondes.

Créer un bucket Cloud Storage et copier l'exemple d'ensemble de données

Créez un bucket Cloud Storage pour stocker les documents qui serviront à entraîner le modèle AutoML.

  1. Ouvrez Cloud Shell.

  2. Définissez la variable PROJECT_ID sur l'ID de votre projet.

    export PROJECT_ID=PROJECT_ID
  3. Définissez la variable BUCKET, que vous utiliserez pour créer un bucket Cloud Storage.

    export BUCKET=${PROJECT_ID}-lcm
  4. Créez un bucket Cloud Storage dans la région us-central1 avec la variable BUCKET.

    gsutil mb -p ${PROJECT_ID} -l us-central1 gs://${BUCKET}/
  5. Copiez l'exemple d'ensemble de données d'entraînement happiness.csv dans votre bucket.

    gsutil -m cp -R gs://cloud-ml-data/NL-classification/happiness.csv gs://${BUCKET}/text/

Étape suivante

Suivez la page suivante de ce tutoriel pour utiliser la console Vertex AI afin de créer un ensemble de données de classification de texte et d'importer les documents que vous avez copiés dans votre bucket Cloud Storage.