Présentation de l'obtention de prédictions sur Vertex AI

Une prédiction est le résultat d'un modèle de machine learning entraîné. Cette page présente le workflow permettant d'obtenir des prédictions à partir de vos modèles sur Vertex AI.

Vertex AI propose deux méthodes pour obtenir des prédictions :

Les prédictions en ligne sont des requêtes synchrones adressées à un modèle déployé sur un endpoint. Par conséquent, avant d'envoyer une requête, vous devez d'abord déployer la ressource Model sur un point de terminaison. Cette opération associe des ressources de calcul au modèle afin qu'il puisse diffuser des prédictions en ligne avec une faible latence. Utilisez les prédictions en ligne pour effectuer des requêtes en réponse à des entrées d'application ou dans des situations nécessitant une inférence rapide.
Les prédictions par lots sont des requêtes asynchrones adressées à un modèle non déployé sur un point de terminaison. Vous envoyez la requête (en tant que ressource BatchPredictionsJob) directement à la ressource Model. Utilisez les prédictions par lot lorsque vous n'avez pas besoin d'une réponse immédiate et souhaitez traiter les données accumulées en une seule requête.

Obtenir des prédictions à partir de modèles entraînés personnalisés

Pour obtenir des prédictions, vous devez d'abord importer votre modèle. Une fois importé, il devient une ressource Model visible dans Vertex AI Model Registry.

Consultez ensuite la documentation suivante pour savoir comment obtenir des prédictions :

Obtenir des prédictions à partir de modèles AutoML

Contrairement aux modèles entraînés personnalisés, les modèles AutoML sont automatiquement importés dans Vertex AI Model Registry après l'entraînement.

En dehors de cela, le workflow des modèles AutoML est similaire, mais varie légèrement en fonction de votre type de données et de votre objectif de modèle. La documentation permettant d'obtenir des prédictions AutoML se trouve à côté de l'autre documentation AutoML. Voici les liens vers la documentation :

Image

Découvrez comment obtenir des prédictions à partir des types de modèles AutoML d'images suivants :

Tabulaire

Découvrez comment obtenir des prédictions à partir des types de modèles AutoML tabulaires suivants :

Modèles de classification et de régression tabulaires
- Prédictions en ligne
- Batch predictions
Modèles de prévision tabulaires (prédictions par lot uniquement)

Texte

Découvrez comment obtenir des prédictions à partir des types de modèles AutoML de texte suivants :

Vidéo

Découvrez comment obtenir des prédictions à partir des types de modèles AutoML de vidéos suivants :

Modèles de reconnaissance d'actions dans des vidéos (prédictions par lot uniquement)
Modèles de classification de vidéos (prédictions par lot uniquement)
Modèles de suivi d'objets vidéo (prédictions par lot uniquement)

Obtenir des prédictions à partir de modèles BigQuery ML

Il existe deux façons d'obtenir des prédictions à partir des modèles BigQuery ML :

Vous pouvez demander des prédictions par lots directement à partir du modèle dans BigQuery ML.
Vous pouvez enregistrer les modèles directement auprès de Model Registry, sans les exporter depuis BigQuery ML ni les importer dans Model Registry.