Démarrage rapide des modèles hébergés dans le cloud

Ce guide de démarrage rapide vous présente les processus suivants :

  • Copier un ensemble d’images dans Google Cloud Storage.
  • Créer un fichier CSV répertoriant les images et leurs libellés.
  • Utiliser AutoML Vision pour créer un ensemble de données, puis pour entraîner et déployer un modèle.

Avant de commencer

Configurer votre projet

  1. Connectez-vous à votre compte Google.

    Si vous n'en possédez pas déjà un, vous devez en créer un.

  2. Dans Cloud Console, sur la page de sélection du projet, sélectionnez ou créez un projet Cloud.

    Accéder à la page de sélection du projet

  3. Vérifiez que la facturation est activée pour votre projet Google Cloud. Découvrez comment vérifier que la facturation est activée pour votre projet.

  4. Activer les API AutoML and Cloud Storage.

    Activer les API

  5. Installez l'outil de ligne de commande gcloud.
  6. Suivez les instructions pour créer un compte de service et télécharger un fichier de clé associé.
  7. Indiquez le chemin d'accès au fichier de clé du compte de service, que vous avez téléchargé lors de la création de ce dernier, comme variable d'environnement GOOGLE_APPLICATION_CREDENTIALS.
    export GOOGLE_APPLICATION_CREDENTIALS=key-file
  8. Pour la variable d'environnement PROJECT_ID, indiquez l'ID de votre projet.
    export PROJECT_ID=your-project-id
    Les noms de ressources et les appels d'API AutoML incluent votre ID de projet. La variable d’environnement PROJECT_ID constitue un moyen pratique de spécifier l’ID.
  9. Si vous êtes propriétaire du projet, ajoutez votre compte de service au rôle IAM Éditeur AutoML, en remplaçant service-account-name par le nom de votre nouveau compte de service. Par exemple, service-account1@myproject.iam.gserviceaccount.com.
    gcloud auth login
    gcloud projects add-iam-policy-binding $PROJECT_ID \
       --member="serviceAccount:service-account-name" \
       --role="roles/automl.editor"
    
  10. Si vous n'êtes pas propriétaire du projet, demandez au propriétaire d'ajouter votre ID utilisateur et votre compte de service au rôle IAM Éditeur AutoML.

Créer un bucket Cloud Storage

Créez votre bucket Cloud Storage à l'aide de Cloud Shell, une ligne de commande Linux accessible dans un navigateur et connectée à votre projet Cloud Console :

  1. Ouvrez Cloud Shell.

  2. Créez un bucket Google Cloud Storage. Le nom du bucket doit respecter le format suivant : project-id-vcm.

    La commande ci-dessous permet de créer un bucket de stockage dans la région us-central1, nommé project-id-vcm. Pour obtenir la liste complète des régions disponibles, consultez la page Emplacement des buckets.

    gsutil mb -p ${PROJECT_ID} -c regional -l us-central1 gs://${PROJECT_ID}-vcm/

  3. Définissez la variable BUCKET.

    export BUCKET=${PROJECT_ID}-vcm

Copier les exemples d'images dans le bucket

Ensuite, copiez l'ensemble de données de fleurs utilisé dans cet article de blog Tensorflow. Les images sont stockées dans un bucket Cloud Storage public. Vous pouvez donc les copier directement dans votre propre bucket.

  1. Dans votre session Cloud Shell, entrez la commande suivante :

    gsutil -m cp -R gs://cloud-ml-data/img/flower_photos/ gs://${BUCKET}/img/
    

    La copie des fichiers prend environ 20 minutes.

Créer le fichier CSV

L'exemple d'ensemble de données contient un fichier CSV avec tous les emplacements d'images et les libellés pour chaque image. Vous allez l'utiliser pour créer votre propre fichier CSV :

  1. Mettez à jour le fichier CSV de sorte qu'il pointe vers les fichiers de votre bucket :

    gsutil cat gs://${BUCKET}/img/flower_photos/all_data.csv | sed "s:cloud-ml-data:${BUCKET}:" > all_data.csv
    
  2. Copiez le fichier CSV dans le bucket :

    gsutil cp all_data.csv gs://${BUCKET}/csv/
    

Créer votre ensemble de données

Accédez à l'interface utilisateur AutoML Vision pour commencer le processus de création de l'ensemble de données et d'entraînement de votre modèle.

Lorsque vous y êtes invité, veillez à sélectionner le projet que vous avez utilisé pour créer le bucket Cloud Storage.

  1. Sur la page "AutoML Vision", cliquez sur Nouvel ensemble de données :

    Nouveau bouton d'ensemble de données dans la console

  2. Spécifiez un nom pour cet ensemble de données. Cliquez sur le signe + pour continuer.

    Nouveau champ de nom d'ensemble de données

  3. Sur l'écran Select files to import (Sélectionner les fichiers à importer), cochez la case d'option Select a CSV file on Cloud Storage (Sélectionner un fichier CSV sur Cloud Storage). Spécifiez l'URI Cloud Storage de votre fichier CSV. Le fichier CSV utilisé dans ce guide de démarrage rapide se situe à l'emplacement :

    • gs://${PROJECT_ID}-vcm/csv/all_data.csv

    Remplacez PROJECT_ID par l'ID de votre projet.

    Écran de sélection du fichier à importer

  4. Cliquez sur Continuer pour lancer l'importation de l'image. Le processus d'importation prend quelques minutes. Une fois l'opération terminée, vous êtes dirigé sur la page suivante, qui présente des informations détaillées sur toutes les images (avec et sans étiquettes) identifiées dans votre ensemble de données.

    Images répertoriées une fois l'importation terminée

Entraîner le modèle

  1. Une fois l'ensemble de données créé et traité, sélectionnez l'onglet Entraînement pour commencer l'entraînement du modèle.

    Sélection de l'onglet Train (Entraîner)

  2. Sélectionnez Démarrer l'entraînement pour continuer. Une fenêtre Entraîner un nouveau modèle s'ouvre et propose des options d'entraînement.

  3. Dans la section Define your model (Définir votre modèle) de la nouvelle fenêtre d'entraînement, modifiez le nom du modèle (facultatif) et cochez la case d'option Cloud hosted (Hébergé dans le cloud). Cliquez sur Continue (Continuer) pour passer à la section suivante.

    Section

  4. Dans la section Set a node hour budget (Définir un budget pour une heure de nœud), acceptez le budget d'heures de nœud recommandé (32).

    Entraînement d'un modèle Edge

  5. Sélectionnez Start training (Démarrer l'entraînement) pour commencer l'entraînement du modèle.

    L'entraînement du modèle commence et prend environ une heure. Il peut s'arrêter avant l'heure de nœud que vous avez sélectionnée. Le service vous enverra un e-mail à la fin de l'entraînement ou si des erreurs se sont produites.

Utiliser le modèle personnalisé

Une fois l'entraînement de votre modèle mené à bien, vous pouvez vous en servir pour identifier des images. Sélectionnez l'onglet Test et utilisation.

Si vous n'avez pas opté pour le déploiement automatique, vous serez invité à déployer votre modèle avant de pouvoir effectuer des prédictions.

Effectuer une prédiction

Pour savoir comment envoyer une image à votre modèle et effectuer une prédiction, cliquez sur l'onglet Predict (Prédiction). Vous pouvez également consulter des exemples dans les sections Effectuer une prédiction en ligne ou Effectuer des prédictions par lot.

Nettoyage

Si vous n'avez plus besoin de votre modèle personnalisé ou de votre ensemble de données, vous pouvez les supprimer.

Pour éviter d'encourir des frais inutiles liés à Google Cloud Platform, supprimez votre projet à l'aide de la console GCP si vous n'en avez plus besoin.

Annuler le déploiement du modèle

Des frais vous sont facturés pour le déploiement du modèle. Pour les éviter :

  1. Sélectionnez l'onglet Test & Use (Test et utilisation) situé juste en dessous de la barre de titre.
  2. Sélectionnez Remove deployment (Supprimer le déploiement) dans la bannière située sous le nom de votre modèle pour ouvrir la fenêtre d'annulation du déploiement.

    menu contextuel d'annulation de déploiement

  3. Sélectionnez Remove deployment (Supprimer le déploiement) pour annuler le déploiement du modèle.

    déploiement du modèle

  4. Vous recevrez un e-mail une fois l'annulation du déploiement du modèle terminée.

Supprimer votre projet (facultatif)

Pour éviter d'encourir des frais inutiles liés à Google Cloud Platform, supprimez votre projet à l'aide de Cloud Console si vous n'en avez plus besoin.

Étapes suivantes