Cette page explique comment utiliser Vertex AI pour exporter votre modèle tabulaire AutoML vers Cloud Storage, télécharger le modèle sur un serveur sur site ou un serveur hébergé par un autre fournisseur cloud, puis utiliser Docker pour rendre le modèle disponible pour les prédictions.
Pour en savoir plus sur l'exportation de modèles Edge d'images et de vidéo, consultez la section Exporter des modèles AutoML Edge.
Après avoir exporté votre modèle tabulaire, si vous souhaitez le réimporter dans Vertex AI, consultez la page Importer des modèles dans Vertex AI.
Limites
L'exportation de modèles tabulaires AutoML présente les limites suivantes :
Remarque : Vous ne pouvez exporter que les modèles de classification et de régression tabulaires AutoML. L'exportation de modèles de prévision tabulaires AutoML n'est pas acceptée.
Vertex Explainable AI n'est pas disponible avec les modèles tabulaires exportés. Si vous devez utiliser Vertex Explainable AI, vous devez diffuser des prédictions à partir d'un modèle hébergé par Vertex AI.
Le modèle tabulaire exporté ne peut s'exécuter que sur les processeurs d'architecture x86 compatibles avec les ensembles d'instructions AVX (Advanced Vector Extensions).
Processus d'exportation
La procédure pour exporter votre modèle est la suivante :
- Configurez votre environnement.
- Exporter le modèle.
- Extraire et exécuter le serveur de modèles
- Demander des prédictions.
Avant de commencer
Avant de pouvoir effectuer cette tâche, vous devez avoir réalisé les opérations suivantes :
- Configurez votre projet comme décrit dans la section Configurer l'environnement cloud.
- Entraînez le modèle que vous souhaitez télécharger.
- Installez et initialisez Google Cloud CLI sur le serveur que vous utiliserez pour exécuter le modèle exporté.
- Installez Docker sur votre serveur.
Exporter le modèle
Console
Accédez à la page Modèles de Google Cloud Console, dans la section Vertex AI.
Cliquez sur le modèle tabulaire que vous souhaitez exporter pour ouvrir sa page d'informations.
Cliquez sur Exporter dans la barre de boutons pour exporter votre modèle.
Sélectionnez ou créez un dossier Cloud Storage à l'emplacement souhaité.
Le bucket doit répondre aux exigences de bucket.
Vous ne pouvez pas exporter un modèle vers un bucket de niveau supérieur. Vous devez utiliser au moins un niveau de dossier.
Pour de meilleurs résultats, créez un dossier vide. Vous copierez l'intégralité du contenu du dossier à une étape ultérieure.
Cliquez sur Exporter.
Vous allez télécharger le modèle exporté sur votre serveur dans la section suivante.
REST
Vous utilisez la méthode models.export pour exporter un modèle vers Cloud Storage.Avant d'utiliser les données de requête ci-dessous, effectuez les remplacements suivants :
- LOCATION : votre région.
- PROJECT : l'ID de votre projet.
- MODEL_ID : ID du modèle que vous souhaitez exporter.
-
GCS_DESTINATION : dossier de destination dans
Cloud Storage. Par exemple,
gs://export-bucket/exports
.Vous ne pouvez pas exporter un modèle vers un bucket de niveau supérieur. Vous devez utiliser au moins un niveau de dossier.
Ce dossier doit être conforme aux exigences de bucket.
Pour de meilleurs résultats, créez un dossier. Vous copierez l'intégralité du contenu du dossier à une étape ultérieure.
Méthode HTTP et URL :
POST https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT/locations/LOCATION/models/MODEL_ID:export
Corps JSON de la requête :
{ "outputConfig": { "exportFormatId": "tf-saved-model", "artifactDestination": { "outputUriPrefix": "GCS_DESTINATION" } } }
Pour envoyer votre requête, choisissez l'une des options suivantes :
curl
Enregistrez le corps de la requête dans un fichier nommé request.json
, puis exécutez la commande suivante :
curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT/locations/LOCATION/models/MODEL_ID:export"
PowerShell
Enregistrez le corps de la requête dans un fichier nommé request.json
, puis exécutez la commande suivante :
$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }
Invoke-WebRequest `
-Method POST `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT/locations/LOCATION/models/MODEL_ID:export" | Select-Object -Expand Content
Vous devriez recevoir une réponse JSON de ce type :
{ "name": "projects/PROJECT_NUMBER/locations/LOCATION/models/MODEL_ID/operations/OPERATION_ID", "metadata": { "@type": "type.googleapis.com/google.cloud.aiplatform.v1.ExportModelOperationMetadata", "genericMetadata": { "createTime": "2020-10-12T20:53:40.130785Z", "updateTime": "2020-10-12T20:53:40.130785Z" }, "outputInfo": { "artifactOutputUri": "gs://OUTPUT_BUCKET/model-MODEL_ID/EXPORT_FORMAT/YYYY-MM-DDThh:mm:ss.sssZ" } } }
Java
Avant d'essayer cet exemple, suivez les instructions de configuration pour Java décrites dans le guide de démarrage rapide de Vertex AI à l'aide des bibliothèques clientes. Pour en savoir plus, consultez la documentation de référence de l'API Vertex AI Java.
Pour vous authentifier auprès de Vertex AI, configurez le service Identifiants par défaut de l'application. Pour en savoir plus, consultez Configurer l'authentification pour un environnement de développement local.
Node.js
Avant d'essayer cet exemple, suivez les instructions de configuration pour Node.js décrites dans le guide de démarrage rapide de Vertex AI à l'aide des bibliothèques clientes. Pour en savoir plus, consultez la documentation de référence de l'API Vertex AI Node.js.
Pour vous authentifier auprès de Vertex AI, configurez le service Identifiants par défaut de l'application. Pour en savoir plus, consultez Configurer l'authentification pour un environnement de développement local.
Python
Pour savoir comment installer ou mettre à jour le SDK Vertex AI pour Python, consultez la section Installer le SDK Vertex AI pour Python. Pour en savoir plus, consultez la documentation de référence de l'API Python.
Obtenir l'état d'une opération d'exportation
Certaines requêtes démarrent des opérations de longue durée qui nécessitent du temps. Ces requêtes renvoient un nom d'opération, que vous pouvez utiliser pour afficher l'état de l'opération ou pour annuler l'opération. Vertex AI propose des méthodes d'assistance pour appeler les opérations de longue durée. Pour en savoir plus, consultez la section Travailler avec des opérations de longue durée.
Extraire et exécuter le serveur de modèles
Dans cette tâche, vous allez télécharger le modèle exporté à partir de Cloud Storage et démarrer le conteneur Docker pour que votre modèle soit prêt à recevoir des requêtes de prédiction.
Pour extraire et exécuter le serveur de modèles, procédez comme suit :
Sur la machine sur laquelle vous allez exécuter le modèle, accédez au répertoire dans lequel vous souhaitez enregistrer le modèle exporté.
Téléchargez le modèle exporté :
gcloud storage cp <var>gcs-destination</var> . --recursive
Où gcs-destination est le chemin d'accès à l'emplacement du modèle exporté dans Cloud Storage.
Le modèle est copié dans votre répertoire actuel, sous le chemin suivant :
./model-<model-id>/tf-saved-model/<export-timestamp>
Le chemin d'accès peut contenir
tf-saved-model
oucustom-trained
.Renommez le répertoire afin que l'horodatage soit supprimé.
mv model-<model-id>/tf-saved-model/<export-timestamp> model-<model-id>/tf-saved-model/<new-dir-name>
L'horodatage rend le répertoire non valide pour Docker.
Extrayez l'image Docker du serveur de modèles.
sudo docker pull MODEL_SERVER_IMAGE
L'image du serveur de modèles à extraire se trouve dans le fichier
environment.json
du répertoire du modèle exporté. Il doit comporter le chemin suivant :./model-<model-id>/tf-saved-model/<new-dir-name>/environment.json
Si aucun fichier environment.json n'est présent, utilisez :
MULTI_REGION-docker.pkg.dev/vertex-ai/automl-tabular/prediction-server-v1
Remplacez
MULTI_REGION
parus
,europe
ouasia
pour sélectionner le dépôt Docker à partir duquel vous souhaitez extraire l'image Docker. Chaque dépôt fournit la même image Docker, mais le choix de l'emplacement multirégional de Artifact Registry le plus proche de la machine sur laquelle vous exécutez Docker est susceptible de réduire la latence.Démarrez le conteneur Docker en utilisant le nom de répertoire que vous venez de créer :
docker run -v `pwd`/model-<model-id>/tf-saved-model/<new-dir-name>:/models/default -p 8080:8080 -it MODEL_SERVER_IMAGE
Vous pouvez arrêter le serveur de modèles à tout moment à l'aide de Ctrl-C
.
Mettre à jour le conteneur Docker du modèle
Étant donné que vous téléchargez le conteneur Docker du modèle lors de l'exportation du modèle, vous devez explicitement mettre à jour le serveur de modèles pour obtenir des mises à jour et des corrections de bugs. Vous devez mettre à jour le serveur de modèles régulièrement à l'aide de la commande suivante :
docker pull MODEL_SERVER_IMAGE
Assurez-vous que l'URI de l'image Docker correspond à l'URI de l'image Docker que vous avez extraite précédemment.
Obtenir des prédictions à partir du modèle exporté
Le serveur de modèles du conteneur d'images d'IA Vertex traite les requêtes de prédiction et renvoie des résultats de la prédiction.
La prédiction par lot n'est pas disponible pour les modèles exportés.
Format des données de prédiction
Vous renseignez le champ de données payload
pour votre requête de prédiction au format JSON suivant :
{ "instances": [ { "column_name_1": value, "column_name_2": value, … } , … ] }
L'exemple suivant montre une requête comportant trois colonnes : une colonne catégorielle, un tableau numérique et une structure. La requête contient deux lignes.
{ "instances": [ { "categorical_col": "mouse", "num_array_col": [ 1, 2, 3 ], "struct_col": { "foo": "piano", "bar": "2019-05-17T23:56:09.05Z" } }, { "categorical_col": "dog", "num_array_col": [ 5, 6, 7 ], "struct_col": { "foo": "guitar", "bar": "2019-06-17T23:56:09.05Z" } } ] }
Envoyer la requête de prédiction
Copiez les données de votre requête dans un fichier texte, par exemple,
tmp/request.json
.Le nombre de lignes de données dans la requête de prédiction, dénommé taille de mini-lot, a une incidence sur la latence et le débit de la prédiction. Plus la taille du mini-lot est élevée, plus la latence et le débit augmentent. Pour réduire la latence, diminuez la taille de mini-lot. Pour augmenter le débit, augmentez la taille de mini-lot. Les tailles de mini-lot les plus couramment utilisées sont 1, 32, 64, 128, 256, 512 et 1024.
Demandez la prédiction :
curl -X POST --data @/tmp/request.json http://localhost:8080/predict
Format des résultats de la prédiction
Le format des résultats dépend de l'objectif de votre modèle.
Résultats d'un modèle de classification
Les résultats de la prédiction pour les modèles de classification (binaires et multiclasses) affichent un score de probabilité pour chaque valeur potentielle de la colonne cible. Vous devez déterminer comment vous souhaitez utiliser les scores. Par exemple, pour obtenir une classification binaire à partir des scores fournis, vous devez identifier une valeur de seuil. S'il existe deux classes, A et B, vous devez classer l'exemple dans A si le score de A est supérieur au seuil choisi, et dans B dans le cas contraire. Pour les ensembles de données déséquilibrés, le seuil peut atteindre 100 % ou 0 %.
La charge utile des résultats d'un modèle de classification ressemble à ce qui suit :
{ "predictions": [ { "scores": [ 0.539999994635582, 0.2599999845027924, 0.2000000208627896 ], "classes": [ "apple", "orange", "grape" ] }, { "scores": [ 0.23999999463558197, 0.35999998450279236, 0.40000002086278963 ], "classes": [ "apple", "orange", "grape" ] } ] }
Résultats d'un modèle de régression
Une valeur prédite s'affiche pour chaque ligne valide de la requête de prédiction. Les intervalles de prédiction ne s'affichent pas pour les modèles exportés.
La charge utile des résultats pour un modèle de régression ressemble à ceci :
{ "predictions": [ { "value": -304.3663330078125, "lower_bound": -56.32196807861328, "upper_bound": 126.51904296875 }, { "value": -112.3663330078125, "lower_bound": 16.32196807861328, "upper_bound": 255.51904296875 } ] }
Étape suivante
- Découvrez comment réimporter votre modèle tabulaire exporté dans Vertex AI.