Données de texte Hello : configurer votre projet et votre environnement

Si vous prévoyez d'utiliser le SDK Vertex AI pour Python, assurez-vous que le compte de service initialisant le client dispose du rôle Agent de service Vertex AI (roles/aiplatform.serviceAgent).

Dans cette partie du tutoriel, vous allez configurer votre projet Google Cloud pour qu'il utilise Vertex AI et un bucket Cloud Storage contenant les documents nécessaires à l'entraînement de votre modèle AutoML.

Ce tutoriel comporte plusieurs pages :

  1. Configurer votre projet et votre environnement.

  2. Créer un ensemble de données de classification de texte.

  3. Entraîner un modèle de classification de texte AutoML.

  4. Déployer le modèle sur un point de terminaison et effectuer une prédiction.

  5. Nettoyer votre projet.

Chaque page suppose que vous avez déjà effectué les instructions des pages précédentes du tutoriel.

Configurer votre projet et votre environnement

Suivez les étapes ci-dessous avant d'utiliser la fonctionnalité Vertex AI.

  1. In the Google Cloud console, go to the project selector page.

    Go to project selector

  2. Select or create a Google Cloud project.

  3. Make sure that billing is enabled for your Google Cloud project.

  4. Ouvrez Cloud Shell. Cloud Shell est un environnement shell interactif pour Google Cloud qui vous permet de gérer vos projets et vos ressources depuis un navigateur Web.
  5. Accéder à Cloud Shell
  6. Dans Cloud Shell, définissez le projet actuel sur votre ID de projet Google Cloud et stockez-le dans la variable d'interface système projectid :
      gcloud config set project PROJECT_ID &&
      projectid=PROJECT_ID &&
      echo $projectid
    Remplacez PROJECT_ID par l'ID du projet. Vous trouverez l'ID de votre projet dans la console Google Cloud. Pour en savoir plus, consultez la section Trouver votre ID de projet.
  7. Enable the IAM, Compute Engine, Notebooks, Cloud Storage, and Vertex AI APIs:

    gcloud services enable iam.googleapis.com  compute.googleapis.com notebooks.googleapis.com storage.googleapis.com aiplatform.googleapis.com
  8. Grant roles to your user account. Run the following command once for each of the following IAM roles: roles/aiplatform.user, roles/storage.admin

    gcloud projects add-iam-policy-binding PROJECT_ID --member="USER_IDENTIFIER" --role=ROLE
    • Replace PROJECT_ID with your project ID.
    • Replace USER_IDENTIFIER with the identifier for your user account. For example, user:myemail@example.com.

    • Replace ROLE with each individual role.
  9. Le rôle IAM d'utilisateur Vertex AI (roles/aiplatform.user) permet d'utiliser toutes les ressources dans Vertex AI. Le rôle Administrateur de l'espace de stockage (roles/storage.admin) vous permet de stocker l'ensemble de données d'entraînement du document dans Cloud Storage.

Créer un bucket Cloud Storage et copier l'exemple d'ensemble de données

Créez un bucket Cloud Storage pour stocker les documents qui serviront à entraîner le modèle AutoML.

  1. Ouvrez Cloud Shell.

  2. Définissez la variable PROJECT_ID sur l'ID de votre projet.

    export PROJECT_ID=PROJECT_ID
  3. Définissez la variable BUCKET, que vous utiliserez pour créer un bucket Cloud Storage.

    export BUCKET=${PROJECT_ID}-lcm
  4. Créez un bucket Cloud Storage dans la région us-central1 avec la variable BUCKET.

    gsutil mb -p ${PROJECT_ID} -l us-central1 gs://${BUCKET}/
  5. Copiez l'exemple d'ensemble de données d'entraînement happiness.csv dans votre bucket.

    gsutil -m cp -R gs://cloud-ml-data/NL-classification/happiness.csv gs://${BUCKET}/text/

Étape suivante

Suivez la page suivante de ce tutoriel pour utiliser la console Vertex AI afin de créer un ensemble de données de classification de texte et d'importer les documents que vous avez copiés dans votre bucket Cloud Storage.