Données de texte Hello : configurer votre projet et votre environnement

Si vous prévoyez d'utiliser le SDK Vertex AI pour Python, assurez-vous que le compte de service initialisant le client dispose du rôle Agent de service Vertex AI (roles/aiplatform.serviceAgent).

Dans cette partie du tutoriel, vous allez configurer votre projet Google Cloud pour qu'il utilise Vertex AI et un bucket Cloud Storage contenant les documents nécessaires à l'entraînement de votre modèle AutoML.

Ce tutoriel comporte plusieurs pages :

  1. Configurer votre projet et votre environnement.

  2. Créer un ensemble de données de classification de texte.

  3. Entraîner un modèle de classification de texte AutoML.

  4. Déployer le modèle sur un point de terminaison et effectuer une prédiction.

  5. Nettoyer votre projet.

Chaque page suppose que vous avez déjà effectué les instructions des pages précédentes du tutoriel.

Configurer votre projet et votre environnement

Suivez les étapes ci-dessous avant d'utiliser la fonctionnalité Vertex AI.

  1. Dans Google Cloud Console, accédez à la page de sélection du projet.

    Accéder au sélecteur de projet

  2. Sélectionnez ou créez un projet Google Cloud.

  3. Vérifiez que la facturation est activée pour votre projet Google Cloud.

  4. Ouvrez Cloud Shell. Cloud Shell est un environnement shell interactif pour Google Cloud qui vous permet de gérer vos projets et vos ressources depuis un navigateur Web.
  5. Accéder à Cloud Shell
  6. Dans Cloud Shell, définissez le projet actuel sur votre ID de projet Google Cloud et stockez-le dans la variable d'interface système projectid :
      gcloud config set project PROJECT_ID &&
      projectid=PROJECT_ID &&
      echo $projectid
    Remplacez PROJECT_ID par l'ID du projet. Vous trouverez l'ID de votre projet dans la console Google Cloud. Pour en savoir plus, consultez la section Trouver votre ID de projet.
  7. Activer les API IAM, Compute Engine, Notebooks, Cloud Storage, and Vertex AI :

    gcloud services enable iam.googleapis.com  compute.googleapis.com notebooks.googleapis.com storage.googleapis.com aiplatform.googleapis.com
  8. Attribuez des rôles à votre compte Google. Exécutez la commande suivante une fois pour chacun des rôles IAM suivants : roles/aiplatform.user, roles/storage.admin

    gcloud projects add-iam-policy-binding PROJECT_ID --member="user:EMAIL_ADDRESS" --role=ROLE
    • en remplaçant PROJECT_ID par l'ID de votre projet :
    • Remplacez EMAIL_ADDRESS par votre adresse e-mail.
    • Remplacez ROLE par chaque rôle individuel.
  9. Le rôle IAM d'utilisateur Vertex AI (roles/aiplatform.user) permet d'utiliser toutes les ressources dans Vertex AI. Le rôle Administrateur de l'espace de stockage (roles/storage.admin) vous permet de stocker l'ensemble de données d'entraînement du document dans Cloud Storage.

Créer un bucket Cloud Storage et copier l'exemple d'ensemble de données

Créez un bucket Cloud Storage pour stocker les documents qui serviront à entraîner le modèle AutoML.

  1. Ouvrez Cloud Shell.

  2. Définissez la variable PROJECT_ID sur l'ID de votre projet.

    export PROJECT_ID=PROJECT_ID
  3. Définissez la variable BUCKET, que vous utiliserez pour créer un bucket Cloud Storage.

    export BUCKET=${PROJECT_ID}-lcm
  4. Créez un bucket Cloud Storage dans la région us-central1 avec la variable BUCKET.

    gsutil mb -p ${PROJECT_ID} -l us-central1 gs://${BUCKET}/
  5. Copiez l'exemple d'ensemble de données d'entraînement happiness.csv dans votre bucket.

    gsutil -m cp -R gs://cloud-ml-data/NL-classification/happiness.csv gs://${BUCKET}/text/

Étape suivante

Suivez la page suivante de ce tutoriel pour utiliser la console Vertex AI afin de créer un ensemble de données de classification de texte et d'importer les documents que vous avez copiés dans votre bucket Cloud Storage.