Obtenir des prédictions de ML à partir de modèles scikit-learn ou XGBoost

Le service de prédiction en ligne AI Platform Prediction gère les ressources de calcul dans le cloud pour exécuter vos modèles. Ces modèles peuvent être des modèles scikit-learn ou XGBoost que vous avez entraînés ailleurs (localement ou via un autre service) et exportés dans un fichier. Cette page décrit le processus d'obtention de prédictions en ligne à partir de ces modèles exportés à l'aide d'AI Platform Prediction.

Avant de commencer

Présentation

Dans ce tutoriel, vous allez entraîner un modèle simple pour prédire des espèces de fleurs, en utilisant l'ensemble de données Iris. Après avoir entraîné et enregistré le modèle localement, vous allez le déployer dans AI Platform Prediction et l'interroger pour obtenir des prédictions en ligne.

Avant de commencer

Suivez les étapes ci-dessous pour configurer un compte GCP, activer l'API AI Platform Prediction, puis installer et activer le SDK Cloud.

Configurer le projet GCP

  1. Connectez-vous à votre compte Google Cloud. Si vous débutez sur Google Cloud, créez un compte pour évaluer les performances de nos produits en conditions réelles. Les nouveaux clients bénéficient également de 300 $ de crédits gratuits pour exécuter, tester et déployer des charges de travail.
  2. Dans Google Cloud Console, sur la page de sélection du projet, sélectionnez ou créez un projet Google Cloud.

    Accéder au sélecteur de projet

  3. Vérifiez que la facturation est activée pour votre projet Google Cloud.

  4. Activer les API AI Platform Training & Prediction and Compute Engine.

    Activer les API

  5. Installez Google Cloud CLI.
  6. Pour initialiser gcloudCLI, exécutez la commande suivante :

    gcloud init
  7. Dans Google Cloud Console, sur la page de sélection du projet, sélectionnez ou créez un projet Google Cloud.

    Accéder au sélecteur de projet

  8. Vérifiez que la facturation est activée pour votre projet Google Cloud.

  9. Activer les API AI Platform Training & Prediction and Compute Engine.

    Activer les API

  10. Installez Google Cloud CLI.
  11. Pour initialiser gcloudCLI, exécutez la commande suivante :

    gcloud init

Configurer votre environnement

Choisissez l'une des options ci-dessous pour configurer votre environnement en local sous macOS ou dans un environnement à distance sur Cloud Shell.

Pour les utilisateurs de macOS, nous vous recommandons de configurer votre environnement à l'aide de l'onglet macOS ci-dessous. Cloud Shell est disponible sous macOS, Linux et Windows (voir l'onglet Cloud Shell). Ce service vous permet d'essayer AI Platform Prediction rapidement. Toutefois, son utilisation n'est pas adaptée aux tâches de développement continu.

macOS

  1. Vérifiez que Python est installé
    Si ce n'est pas le cas, installez Python.

    python -V
  2. Vérifiez que pip est installé
    pip est le gestionnaire de packages de Python, inclus dans les versions actuelles de Python. Vérifiez que pip est déjà installé en exécutant la commande pip --version. Si ce n'est pas le cas, découvrez comment installer pip.

    Vous pouvez mettre à jour pip à l'aide de la commande suivante :

    pip install -U pip

    Pour en savoir plus, consultez la documentation sur pip.

  3. Installez virtualenv
    virtualenv est un outil permettant de créer des environnements Python isolés. Vérifiez que virtualenv est déjà installé en exécutant la commande virtualenv --version. Si ce n'est pas le cas, installez virtualenv :

    pip install --user --upgrade virtualenv

    Dans ce guide, pour créer un environnement de développement isolé, créez un environnement virtuel dans virtualenv. Par exemple, la commande suivante active un environnement nommé aip-env :

    virtualenv aip-env
    source aip-env/bin/activate
  4. Pour les besoins de ce tutoriel, exécutez toutes les autres commandes dans votre environnement virtuel.

    Obtenez plus d'informations sur l'utilisation de virtualenv. Pour quitter virtualenv, exécutez la commande deactivate.

Cloud Shell

  1. Ouvrez Google Cloud Console.

    Google Cloud Console

  2. Cliquez sur le bouton Activer Google Cloud Shell en haut de la fenêtre de la console.

    Activer Google Cloud Shell

    Une session Cloud Shell s'ouvre dans un nouveau cadre en bas de la console et affiche une invite de ligne de commande. L'initialisation de la session Shell peut prendre quelques secondes.

    Session Cloud Shell

    Votre session Cloud Shell est prête à l'emploi.

  3. Configurez l'outil de ligne de commande gcloud pour qu'il utilise le projet sélectionné.

    gcloud config set project [selected-project-id]

    [selected-project-id] correspond à votre ID de projet. (Saisissez-le sans les crochets.)

Installer des frameworks

macOS

Dans votre environnement virtuel, exécutez la commande suivante pour installer les versions de scikit-learn, XGBoost et pandas utilisées dans la version d'exécution 2.11 d'AI Platform Prediction:

(aip-env)$ pip install scikit-learn==1.0.2 xgboost==1.6.2 pandas==1.3.5

En spécifiant les numéros de version dans la commande précédente, vous vous assurez que les dépendances de votre environnement virtuel correspondent à celles de la version d'exécution. Vous évitez ainsi tout comportement inattendu lors de l'exécution de votre code sur AI Platform Prediction.

Pour plus d'informations, y compris sur les options d'installation et les opérations de dépannage, reportez-vous aux instructions d'installation de chaque framework :

Cloud Shell

Exécutez la commande suivante pour installer scikit-learn, XGBoost et pandas :

pip install --user scikit-learn xgboost pandas

Pour plus d'informations, y compris sur les options d'installation et les opérations de dépannage, reportez-vous aux instructions d'installation de chaque framework :

Versions de scikit-learn et XGBoost

Les versions d'exécution d'AI Platform Prediction sont régulièrement mises à jour pour inclure la compatibilité avec les nouvelles versions de scikit-learn et XGBoost. Consultez les détails complets de chaque version d'exécution.

Entraîner et enregistrer un modèle

Commencez par entraîner un modèle simple pour l'ensemble de données Iris.

scikit-learn

En suivant l'exemple scikit-learn sur la persistance des modèles, vous pouvez entraîner et exporter un modèle comme indiqué ci-dessous :

from sklearn.externals import joblib
from sklearn import datasets
from sklearn import svm

# Load the Iris dataset
iris = datasets.load_iris()

# Train a classifier
classifier = svm.SVC()
classifier.fit(iris.data, iris.target)

# Export the classifier to a file
joblib.dump(classifier, 'model.joblib')

Pour exporter le modèle, vous avez également la possibilité d'utiliser la bibliothèque pickle comme suit :

import pickle
with open('model.pkl', 'wb') as model_file:
  pickle.dump(classifier, model_file)

XGBoost

Vous pouvez exporter le modèle en utilisant la méthode "save_model" de l'objet Booster.

Pour les besoins de ce tutoriel, scikit-learn est utilisé avec XGBoost uniquement pour importer l'ensemble de données Iris.

from sklearn import datasets
import xgboost as xgb

# Load the Iris dataset
iris = datasets.load_iris()

# Load data into DMatrix object
dtrain = xgb.DMatrix(iris.data, label=iris.target)

# Train XGBoost model
bst = xgb.train({}, dtrain, 20)

# Export the classifier to a file
bst.save_model('./model.bst')

Pour exporter le modèle, vous avez également la possibilité d'utiliser la bibliothèque pickle comme suit :

import pickle
with open('model.pkl', 'wb') as model_file:
  pickle.dump(bst, model_file)

Règles de dénomination des fichiers de modèle

Pour la prédiction en ligne, le fichier de modèle enregistré que vous importez dans Cloud Storage doit porter le nom suivant : model.pkl, model.joblib ou model.bst, selon la bibliothèque utilisée. Cette restriction garantit que, lors de l'importation, AI Platform Prediction reconstruit le modèle à l'aide du même schéma que celui utilisé lors de l'exportation.

Cette exigence ne s'applique pas si vous créez une routine de prédiction personnalisée (version bêta).

scikit-learn

Bibliothèque utilisée pour exporter le modèle Nom de modèle correct
pickle model.pkl
sklearn.externals.joblib model.joblib

XGBoost

Bibliothèque utilisée pour exporter le modèle Nom de modèle correct
pickle model.pkl
joblib model.joblib
xgboost.Booster model.bst

Pour les futures itérations de votre modèle, organisez votre bucket Cloud Storage de sorte que chaque nouveau modèle dispose d'un répertoire dédié.

Stocker le modèle dans Cloud Storage

Dans le cadre de ce tutoriel, la procédure la plus simple consiste à utiliser un bucket Cloud Storage dédié dans le même projet que pour AI Platform Prediction.

Si vous utilisez un bucket dans un autre projet, vous devez vous assurer que votre compte de service AI Platform Prediction peut accéder à votre modèle dans Cloud Storage. Sans les autorisations appropriées, votre requête de création d'une version de modèle AI Platform Prediction ne peut pas aboutir. En savoir plus sur l'octroi d'autorisations relatives au stockage.

Configurer un bucket Cloud Storage

Vous trouverez dans cette section la procédure à suivre pour créer un bucket. Vous pouvez utiliser un bucket existant, mais il doit se trouver dans la même région que celle où vous prévoyez d'exécuter des tâches AI Platform. En outre, s'il ne fait pas partie du projet que vous utilisez pour exécuter AI Platform Prediction, vous devez accorder l'accès aux comptes de service AI Platform Prediction.

  1. Indiquez un nom pour votre nouveau bucket. Ce nom doit être unique par rapport à tous les buckets dans Cloud Storage.

    BUCKET_NAME="YOUR_BUCKET_NAME"

    Par exemple, utilisez le nom de votre projet en ajoutant -aiplatform:

    PROJECT_ID=$(gcloud config list project --format "value(core.project)")
    BUCKET_NAME=${PROJECT_ID}-aiplatform
  2. Vérifiez le nom du bucket que vous avez créé.

    echo $BUCKET_NAME
  3. Sélectionnez une région pour votre bucket, puis définissez une variable d'environnement REGION.

    Utilisez la même région que celle où vous prévoyez d'exécuter des tâches AI Platform Prediction. Consultez la liste des régions disponibles pour les services AI Platform Prediction.

    Par exemple, le code suivant crée la variable REGION et la définit sur us-central1:

    REGION=us-central1
  4. Créez le bucket :

    gsutil mb -l $REGION gs://$BUCKET_NAME

Importer le fichier de modèle exporté dans Cloud Storage

Exécutez la commande suivante pour transférer le modèle que vous avez exporté précédemment dans ce tutoriel vers votre bucket dans Cloud Storage :

gsutil cp ./model.joblib gs://$BUCKET_NAME/model.joblib

Vous pouvez utiliser le même bucket Cloud Storage pour plusieurs fichiers de modèle. Chaque fichier de modèle doit se trouver dans son propre répertoire à l'intérieur du bucket.

Mettre en forme les données pour la prédiction

gcloud

Créez un fichier input.json en plaçant chaque instance de données de saisie sur une ligne séparée :

[6.8,  2.8,  4.8,  1.4]
[6.0,  3.4,  4.5,  1.6]

Notez que le format des instances d'entrée doit correspondre au format attendu par le modèle. Dans cet exemple, le modèle Iris nécessite quatre caractéristiques, de sorte que vos données de saisie doivent constituer une matrice de forme (num_instances, 4).

API REST

Créez un fichier input.json formaté comme une simple liste de valeurs flottantes, chaque instance de données de saisie étant placée sur une ligne séparée :

{
  "instances": [

    [6.8,  2.8,  4.8,  1.4],
    [6.0,  3.4,  4.5,  1.6]

  ]
}

Notez que le format des instances d'entrée doit correspondre au format attendu par le modèle. Dans cet exemple, le modèle Iris nécessite quatre caractéristiques, de sorte que vos données de saisie doivent constituer une matrice de forme (num_instances, 4).

Pour XGBoost, AI Platform Prediction n'accepte pas la représentation creuse des instances d'entrée. Si la valeur d'une caractéristique est de zéro, utilisez 0.0 dans l'entrée correspondante. Si la valeur d'une caractéristique est de zéro, utilisez NaN dans l'entrée correspondante.

En savoir plus sur la mise en forme de vos entrées pour la prédiction en ligne.

Tester le modèle avec des prédictions locales

Vous pouvez utiliser la commande gcloud ai-platform local predict pour tester la façon dont votre modèle diffuse des prédictions avant de le déployer dans AI Platform Prediction. La commande effectue des prédictions à l'aide des dépendances de votre environnement local et renvoie les résultats au même format que la commande gcloud ai-platform predict lorsqu'elle effectue des prédictions en ligne. Les tests de prédictions en local peuvent vous permettre de détecter les erreurs avant d'engager des coûts pour les requêtes de prédiction en ligne.

Pour l'argument --model-dir, spécifiez un répertoire contenant votre modèle de machine learning exporté sur votre ordinateur local ou dans Cloud Storage. Pour l'argument --framework, spécifiez tensorflow, scikit-learn ou xgboost. Vous ne pouvez pas exécuter la commande gcloud ai-platform local predict avec une routine de prédiction personnalisée.

L'exemple suivant montre comment effectuer une prédiction locale :

gcloud ai-platform local predict --model-dir LOCAL_OR_CLOUD_STORAGE_PATH_TO_MODEL_DIRECTORY/ \
  --json-instances LOCAL_PATH_TO_PREDICTION_INPUT.JSON \
  --framework NAME_OF_FRAMEWORK

Déployer des modèles et des versions

AI Platform Prediction organise vos modèles entraînés à l'aide de ressources de model et de model. Un modèle AI Platform Prediction est un conteneur pour les versions de votre modèle de machine learning.

Pour déployer un modèle, vous créez une ressource de modèle dans AI Platform Prediction, vous créez ensuite une version de ce modèle, puis vous associez la version du modèle au fichier de modèle stocké dans Cloud Storage.

Créer une ressource de modèle

AI Platform Prediction organise les différentes versions de votre modèle à l'aide de ressources de modèle.

À ce stade, vous devez décider si vous souhaitez que les versions de modèle appartenant à ce modèle utilisent un point de terminaison régional ou le point de terminaison global. Dans la plupart des cas, choisissez un point de terminaison régional. Si vous avez besoin d'une fonctionnalité disponible seulement sur les anciens types de machines (MLS1), utilisez le point de terminaison global.

Vous devez également décider à ce stade si vous souhaitez que les versions de modèle appartenant à ce modèle exportent les journaux lorsqu'ils diffusent des prédictions. Les exemples suivants n'activent pas la journalisation. Découvrez comment activer la journalisation.

Console

  1. Accédez à la page des modèles AI Platform Prediction dans la console Google Cloud :

    Accéder à la page des modèles

  2. Cliquez sur le bouton Nouveau modèle en haut de la page Modèles. La page Créer un modèle s'affiche.

  3. Saisissez un nom unique pour le modèle dans le champ Nom du modèle.

  4. Lorsque la case Utiliser le point de terminaison régional est cochée, AI Platform Prediction utilise un point de terminaison régional. Pour utiliser le point de terminaison mondial, décochez la case Utiliser le point de terminaison régional.

  5. Dans la liste déroulante Région, sélectionnez un emplacement pour vos nœuds de prédiction. Les régions disponibles diffèrent selon que vous utilisez un point de terminaison régional ou un point de terminaison mondial.

  6. Cliquez sur Créer.

  7. Vérifiez que vous êtes revenu sur la page Modèles et que le nouveau modèle figure dans la liste.

gcloud

Point de terminaison régional

Exécutez la commande suivante :

gcloud ai-platform models create MODEL_NAME \
  --region=REGION

Remplacez les éléments suivants :

Si vous ne spécifiez pas l'option --region, gcloud CLI vous invite à sélectionner un point de terminaison régional (ou à utiliser us-central sur le point de terminaison global).

Vous pouvez également définir la propriété ai_platform/region sur une région spécifique afin de vous assurer que gcloud CLI utilise toujours le point de terminaison régional correspondant pour AI Platform Prediction, même lorsque vous ne spécifiez pas l'option --region. (Cette configuration ne s'applique pas aux commandes du groupe de commandes gcloud ai-platform operations.)

Point de terminaison mondial

Exécutez la commande suivante :

gcloud ai-platform models create MODEL_NAME \
  --regions=REGION

Remplacez les éléments suivants :

Si vous ne spécifiez pas l'option --regions, gcloud CLI vous invite à sélectionner un point de terminaison régional (ou à utiliser us-central1 sur le point de terminaison global).

API REST

Point de terminaison régional

  1. Mettez en forme votre requête en plaçant l'objet de modèle dans le corps de la requête. Spécifiez au moins le nom de votre modèle en remplaçant MODEL_NAME dans l'exemple suivant :

    {
      "name": "MODEL_NAME"
    }
    
  2. Effectuez un appel d'API REST vers l'URL suivante, en remplaçant PROJECT_ID par l'ID de votre projet Google Cloud :

    POST https://REGION-ml.googleapis.com/v1/projects/PROJECT_ID/models/
    

    Remplacez les éléments suivants :

    Par exemple, vous pouvez envoyer la requête suivante à l'aide de la commande curl. Cette commande autorise la requête à l'aide des identifiants associés à votre installation de Google Cloud CLI.

    curl -X POST -H "Content-Type: application/json" \
      -d '{"name": "MODEL_NAME"}' \
      -H "Authorization: Bearer `gcloud auth print-access-token`" \
      "https://REGION-ml.googleapis.com/v1/projects/PROJECT_ID/models"
    

    L'API renvoie une réponse semblable à la suivante :

    {
      "name": "projects/PROJECT_ID/models/MODEL_NAME",
      "regions": [
        "REGION"
      ]
    }
    

Point de terminaison mondial

  1. Mettez en forme votre requête en plaçant l'objet de modèle dans le corps de la requête. Spécifiez au moins le nom de votre modèle en remplaçant MODEL_NAME dans l'exemple suivant, ainsi qu'une région en remplaçant REGION par une région compatible avec les anciens types de machines (MLS1) :

    {
      "name": "MODEL_NAME",
      "regions": ["REGION"]
    }
    
  2. Effectuez un appel d'API REST vers l'URL suivante, en remplaçant PROJECT_ID par l'ID de votre projet Google Cloud :

    POST https://ml.googleapis.com/v1/projects/PROJECT_ID/models/
    

    Par exemple, vous pouvez envoyer la requête suivante à l'aide de la commande curl. Cette commande autorise la requête à l'aide des identifiants associés à votre installation de Google Cloud CLI.

    curl -X POST -H "Content-Type: application/json" \
      -d '{"name": "MODEL_NAME", "regions": ["REGION"]}' \
      -H "Authorization: Bearer `gcloud auth print-access-token`" \
      "https://ml.googleapis.com/v1/projects/PROJECT_ID/models"
    

    L'API renvoie une réponse semblable à la suivante :

    {
      "name": "projects/PROJECT_ID/models/MODEL_NAME",
      "regions": [
        "REGION"
      ]
    }
    

Reportez-vous à la page API du modèle AI Platform Prediction pour plus d'informations.

Créer une version de modèle

Vous êtes prêt à créer une version de modèle avec le modèle entraîné que vous avez importé tout à l'heure dans Cloud Storage. Lorsque vous créez une version, vous pouvez spécifier un certain nombre de paramètres. La liste suivante décrit les paramètres courants, dont certains sont obligatoires :

  • name : doit être unique dans le modèle AI Platform Prediction.
  • deploymentUri : chemin d'accès au répertoire de modèle dans Cloud Storage.

    • Si vous déployez un modèle TensorFlow, il s'agit d'un répertoire SavedModel.
    • Si vous déployez un modèle scikit-learn ou XGBoost, il s'agit du répertoire contenant votre fichier model.joblib, model.pkl ou model.bst.
    • Si vous déployez une routine de prédiction personnalisée, il s'agit du répertoire contenant tous vos artefacts de modèle. La taille totale de ce répertoire doit être inférieure ou égale à 500 Mo.
  • framework : TENSORFLOW, SCIKIT_LEARN ou XGBOOST.

  • runtimeVersion : version d'exécution basée sur les dépendances dont votre modèle a besoin. Si vous déployez un modèle scikit-learn ou XGBoost, celle-ci doit au moins correspondre à la version 1.4. Si vous prévoyez d'utiliser la version de modèle pour la prédiction par lot, vous devez utiliser la version d'exécution 2.1 ou une version antérieure.

  • pythonVersion : la version de Python doit être définie à la valeur 3.5 (pour les versions d'exécution 1.4 à 1.14) ou 3.7 (pour les versions d'exécution 1.15 et ultérieures) afin d'être compatible avec les fichiers de modèle exportés avec Python 3. Ce paramètre peut également être défini sur 2.7 pour les versions d'exécution 1.15 et antérieures.

  • machineType (facultatif) : type de machine virtuelle utilisé par AI Platform Prediction pour les nœuds qui diffusent des prédictions. Apprenez-en plus sur les types de machines. Si ce paramètre n'est pas défini, sa valeur par défaut est n1-standard-2 sur les points de terminaison régionaux, et mls1-c1-m2 sur le point de terminaison global.

Pour en savoir plus sur chacun de ces paramètres, ainsi que sur d'autres paramètres moins courants, consultez la documentation de référence de l'API pour la ressource de version.

En outre, si vous avez créé votre modèle sur un point de terminaison régional, assurez-vous également de créer la version sur le même point de terminaison régional.

Console

  1. Accédez à la page des modèles AI Platform Prediction dans la console Google Cloud :

    Accéder à la page des modèles

  2. Sur la page Modèles, sélectionnez le nom de la ressource de modèle que vous souhaitez utiliser pour créer votre version. La page Informations sur le modèle s'affiche.

  3. En haut de la page Informations sur le modèle, cliquez sur le bouton Nouvelle version. La page Créer une version s'affiche.

  4. Saisissez le nom de la version dans le champ Nom. Saisissez éventuellement une description de cette version dans le champ Description.

  5. Renseignez les informations relatives à l'entraînement de votre modèle à l'aide des listes déroulantes correspondantes :

    • Sélectionnez la Version Python utilisée pour entraîner le modèle.
    • Sélectionnez le Framework et la Version du framework.
    • Sélectionnez la Version d'exécution de ML. En savoir plus sur les versions d'exécution d'AI Platform Prediction.
  6. Si vous le souhaitez, sélectionnez un Type de machine pour exécuter la prédiction en ligne.

  7. Dans le champ URI du modèle, saisissez l'emplacement du bucket Cloud Storage dans lequel vous avez importé le fichier de modèle. Vous pouvez utiliser le bouton Parcourir pour trouver le chemin d'accès.

    Veillez à indiquer le chemin d'accès du répertoire contenant le fichier, et non celui du fichier de modèle proprement dit. Par exemple, utilisez gs://your_bucket_name/model-dir/ au lieu de gs://your_bucket_name/model-dir/saved_model.pb ou gs://your_bucket_name/model-dir/model.pkl.

  8. Sélectionnez une option de Scaling pour le déploiement de la prédiction en ligne :

    • Si vous sélectionnez "Autoscaling", le champ facultatif Nombre minimal de nœuds s'affiche. Vous pouvez alors saisir le nombre minimal de nœuds à exécuter en permanence en cas de réduction du service.

    • Si vous sélectionnez "Scaling manuel", vous devez saisir le Nombre de nœuds qui doivent être exécutés à tout moment.

    Découvrez en quoi les options de scaling diffèrent selon le type de machine.

    Consultez la section Plus d'informations sur les frais liés aux prédictions.

  9. Pour terminer la création de votre version de modèle, cliquez sur Enregistrer.

gcloud

  1. Définissez les variables d'environnement pour stocker le chemin d'accès au répertoire Cloud Storage dans lequel se trouve le fichier binaire du modèle, le nom du modèle, le nom de la version et le framework de votre choix.

    Lorsque vous créez une version avec gcloud CLI, vous pouvez fournir le nom du framework en majuscules avec des traits de soulignement (par exemple, SCIKIT_LEARN) ou en minuscules avec des tirets (par exemple, scikit-learn). Les deux options permettent d'obtenir un comportement identique.

    Remplacez [VALUES_IN_BRACKETS] par les valeurs appropriées :

    MODEL_DIR="gs://your_bucket_name/"
    VERSION_NAME="[YOUR-VERSION-NAME]"
    MODEL_NAME="[YOUR-MODEL-NAME]"
    FRAMEWORK="[YOUR-FRAMEWORK_NAME]"
    

  2. Créez la version :

    gcloud ai-platform versions create $VERSION_NAME \
      --model=$MODEL_NAME \
      --origin=$MODEL_DIR \
      --runtime-version=2.11 \
      --framework=$FRAMEWORK \
      --python-version=3.7 \
      --region=REGION \
      --machine-type=MACHINE_TYPE
    

    Remplacez les éléments suivants :

    La création de la version prend quelques minutes. Une fois la version prête, vous devez obtenir le résultat suivant :

    Creating version (this might take a few minutes)......done.
  3. Obtenez des informations sur la nouvelle version :

    gcloud ai-platform versions describe $VERSION_NAME \
      --model=$MODEL_NAME
    

    Le résultat doit ressembler à ce qui suit :

    createTime: '2018-02-28T16:30:45Z'
    deploymentUri: gs://your_bucket_name
    framework: [YOUR-FRAMEWORK-NAME]
    machineType: mls1-c1-m2
    name: projects/[YOUR-PROJECT-ID]/models/[YOUR-MODEL-NAME]/versions/[YOUR-VERSION-NAME]
    pythonVersion: '3.7'
    runtimeVersion: '2.11'
    state: READY

API REST

  1. Mettez en forme le corps de votre requête pour y inclure l'objet de version. Cet exemple spécifie la version name, deploymentUri, runtimeVersion, framework et machineType. Remplacez [VALUES_IN_BRACKETS] par les valeurs appropriées :

    {
      "name": "[YOUR-VERSION-NAME]",
      "deploymentUri": "gs://your_bucket_name/",
      "runtimeVersion": "2.11",
      "framework": "[YOUR_FRAMEWORK_NAME]",
      "pythonVersion": "3.7",
      "machineType": "[YOUR_MACHINE_TYPE]"
    }
    
  2. Envoyez un appel de l'API REST au chemin d'accès suivant, en remplaçant les expressions entre crochets ([VALUES_IN_BRACKETS]) par les valeurs appropriées :

    POST https://REGION-ml.googleapis.com/v1/projects/[YOUR-PROJECT-ID]/models/[YOUR-MODEL-NAME]/versions
    

    Remplacez REGION par la région du point de terminaison régional où vous avez créé votre modèle. Si vous avez créé votre modèle sur le point de terminaison mondial, utilisez ml.googleapis.com.

    Par exemple, vous pouvez envoyer la requête suivante à l'aide de la commande curl :

    curl -X POST -H "Content-Type: application/json" \
      -d '{"name": "[YOUR-VERSION-NAME]", "deploymentUri": "gs://your_bucket_name/", "runtimeVersion": "2.11", "framework": "[YOUR_FRAMEWORK_NAME]", "pythonVersion": "3.7", "machineType": "[YOUR_MACHINE_TYPE]"}' \
      -H "Authorization: Bearer `gcloud auth print-access-token`" \
      "https://REGION-ml.googleapis.com/v1/projects/[YOUR-PROJECT-ID]/models/[YOUR-MODEL-NAME]/versions"
    

    La création de la version prend quelques minutes. Une fois la version prête, vous devez obtenir un résultat semblable à celui-ci :

    {
      "name": "projects/[YOUR-PROJECT-ID]/operations/create_[YOUR-MODEL-NAME]_[YOUR-VERSION-NAME]-[TIMESTAMP]",
      "metadata": {
        "@type": "type.googleapis.com/google.cloud.ml.v1.OperationMetadata",
        "createTime": "2018-07-07T02:51:50Z",
        "operationType": "CREATE_VERSION",
        "modelName": "projects/[YOUR-PROJECT-ID]/models/[YOUR-MODEL-NAME]",
        "version": {
          "name": "projects/[YOUR-PROJECT-ID]/models/[YOUR-MODEL-NAME]/versions/[YOUR-VERSION-NAME]",
          "deploymentUri": "gs://your_bucket_name",
          "createTime": "2018-07-07T02:51:49Z",
          "runtimeVersion": "2.11",
          "framework": "[YOUR_FRAMEWORK_NAME]",
          "machineType": "[YOUR_MACHINE_TYPE]",
          "pythonVersion": "3.7"
        }
      }
    }
    

Envoyer une requête de prédiction en ligne

Une fois que vous avez créé une version de modèle, AI Platform Prediction démarre un nouveau serveur prêt à diffuser les requêtes de prédiction.

gcloud

  1. Définissez les variables d'environnement pour le nom du modèle, le nom de la version et le nom du fichier d'entrée :

    MODEL_NAME="iris"
    VERSION_NAME="v1"
    INPUT_FILE="input.json"
    
  2. Envoyez la requête de prédiction à l'aide de la commande ci-dessous :

    gcloud ai-platform predict --model $MODEL_NAME --version \
      $VERSION_NAME --json-instances $INPUT_FILE
    

Python

Dans cet exemple, nous partons du principe que vous connaissez la bibliothèque cliente Google Cloud pour Python. Si ce n'est pas le cas, consultez la page Utiliser la bibliothèque cliente Python.

import googleapiclient.discovery

def predict_json(project, model, instances, version=None):
    """Send json data to a deployed model for prediction.
    Args:
        project (str): project where the AI Platform Prediction Model is deployed.
        model (str): model name.
        instances ([[float]]): List of input instances, where each input
           instance is a list of floats.
        version: str, version of the model to target.
    Returns:
        Mapping[str: any]: dictionary of prediction results defined by the
            model.
    """
    # Create the AI Platform Prediction service object.
    # To authenticate set the environment variable
    # GOOGLE_APPLICATION_CREDENTIALS=<path_to_service_account_file>
    service = googleapiclient.discovery.build('ml', 'v1')
    name = 'projects/{}/models/{}'.format(project, model)

    if version is not None:
        name += '/versions/{}'.format(version)

    response = service.projects().predict(
        name=name,
        body={'instances': instances}
    ).execute()

    if 'error' in response:
        raise RuntimeError(response['error'])

    return response['predictions']

Consultez plus d'informations sur chacun de ces paramètres dans la section de la documentation de référence de l'API AI Platform Prediction dédiée à l'objet PredictionInput.

Effectuer un nettoyage

Pour éviter que les ressources utilisées sur cette page soient facturées sur votre compte Google Cloud, procédez comme suit :

Étapes suivantes