Une prédiction est le résultat d'un modèle de machine learning entraîné. Cette page présente le workflow permettant d'obtenir des prédictions à partir de vos modèles sur Vertex AI.
Vertex AI propose deux méthodes pour obtenir des prédictions :
Les prédictions en ligne sont des requêtes synchrones adressées à un modèle déployé sur un
endpoint
. Par conséquent, avant d'envoyer une requête, vous devez d'abord déployer la ressourceModel
sur un point de terminaison. Cette opération associe des ressources de calcul au modèle afin qu'il puisse diffuser des prédictions en ligne avec une faible latence. Utilisez les prédictions en ligne pour effectuer des requêtes en réponse à des entrées d'application ou dans des situations nécessitant une inférence rapide.Les prédictions par lots sont des requêtes asynchrones adressées à un modèle non déployé sur un point de terminaison. Vous envoyez la requête (en tant que ressource
BatchPredictionsJob
) directement à la ressourceModel
. Utilisez les prédictions par lot lorsque vous n'avez pas besoin d'une réponse immédiate et souhaitez traiter les données accumulées en une seule requête.
Obtenir des prédictions à partir de modèles entraînés personnalisés
Pour obtenir des prédictions, vous devez d'abord importer votre modèle. Une fois importé, il devient une ressource Model
visible dans Vertex AI Model Registry.
Consultez ensuite la documentation suivante pour savoir comment obtenir des prédictions :
Obtenir des prédictions par lot
Ou
Déployer un modèle sur un point de terminaison et Obtenir des prédictions en ligne.
Obtenir des prédictions à partir de modèles AutoML
Contrairement aux modèles entraînés personnalisés, les modèles AutoML sont automatiquement importés dans Vertex AI Model Registry après l'entraînement.
En dehors de cela, le workflow des modèles AutoML est similaire, mais varie légèrement en fonction de votre type de données et de votre objectif de modèle. La documentation permettant d'obtenir des prédictions AutoML se trouve à côté de l'autre documentation AutoML. Voici les liens vers la documentation :
Image
Découvrez comment obtenir des prédictions à partir des types de modèles AutoML d'images suivants :
Tabulaire
Découvrez comment obtenir des prédictions à partir des types de modèles AutoML tabulaires suivants :
Modèles de classification/régression tabulaires
Modèles de prévision tabulaires (prédictions par lot uniquement)
Texte
Découvrez comment obtenir des prédictions à partir des types de modèles AutoML de texte suivants :
- Modèles de classification de texte
- Modèles d'extraction d'entités textuelles
- Modèles d'analyse des sentiments d'après un texte
Vidéo
Découvrez comment obtenir des prédictions à partir des types de modèles AutoML de vidéos suivants :
- Modèles de reconnaissance d'actions dans des vidéos (prédictions par lot uniquement)
- Modèles de classification de vidéos (prédictions par lot uniquement)
- Modèles de suivi d'objets vidéo (prédictions par lot uniquement)