Tâche Vertex AI – Prédiction

La tâche Vertex AI – Prédiction vous permet d'effectuer une prédiction en ligne. Pour les prédictions en ligne, des requêtes synchrones sont adressées à un point de terminaison du modèle. Vous pouvez utiliser les prédictions en ligne pour effectuer des requêtes en réponse à des entrées d'application ou lorsque vous avez besoin d'inférences en temps opportun.

Vertex AI est un service Google Cloud qui vous permet d'entraîner et de déployer des modèles de ML et des applications d'IA, et de personnaliser des grands modèles de langage (LLM) pour une utilisation dans vos applications basées sur l'IA.

Avant de commencer

Assurez-vous d'effectuer les tâches suivantes dans votre projet Google Cloud avant de configurer la tâche Vertex AI – Prédiction :

Activez l'API Vertex AI (aiplatform.googleapis.com).
Activer l'API Vertex AI
Déployer la ressource "model" sur la ressource "endpoint".
Créez un profil d'authentification. Apigee Integration se connecte à un point de terminaison d'authentification à l'aide d'un profil d'authentification pour la tâche Vertex AI – Prédiction.
Remarque : Si vous créez un profil d'authentification de type Compte de service, assurez-vous ensuite d'attribuer au compte de service le rôle IAM contenant la ou les autorisations IAM suivante(s) :
- aiplatform.endpoints.predict
Pour connaître les autorisations IAM et les rôles IAM prédéfinis qui les octroient, consultez la documentation de référence sur les autorisations IAM.

Pour en savoir plus sur l'attribution de rôles ou d'autorisations supplémentaires à un compte de service, consultez la section Attribuer, modifier et révoquer les accès.
Assurez-vous que VPC Service Controls n'est PAS configuré pour Apigee Integration dans votre projet Google Cloud.
Avertissement : La tâche Vertex AI – Prédiction ne fonctionnera pas ou cessera de fonctionner si VPC Service Controls est configuré pour Apigee Integration dans votre projet Google Cloud.

Configurer la tâche Vertex AI – Prédiction

Dans l'interface utilisateur Apigee, sélectionnez votre organisation Apigee.
Cliquez sur Développer > Intégrations.
Sélectionnez une intégration existante ou créez-en une en cliquant sur Créer une intégration.
Si vous créez une intégration :
1. Saisissez un nom et une description dans la boîte de dialogue Créer une intégration.
2. Dans la liste des régions compatibles, sélectionnez une région pour l'intégration.
3. Cliquez sur Créer.
La page de conception d'intégration s'affiche.
Dans la barre de navigation de la page de conception d'intégration, cliquez sur +Ajouter une tâche ou un déclencheur > Tâches pour afficher la liste des tâches disponibles.
Cliquez sur l'élément Vertex AI – Prédiction et placez-le dans le concepteur d'intégration.
Cliquez sur l'élément Vertex AI – Prédiction dans le concepteur pour afficher le volet de configuration de la tâche Vertex AI – Predict.
Accédez à Authentification, puis sélectionnez un profil d'authentification existant que vous souhaitez utiliser.
Facultatif. Si vous n'avez pas créé de profil d'authentification avant de configurer la tâche, cliquez sur + Nouveau profil d'authentification et suivez les étapes mentionnées dans la section Créer un profil d'authentification.
Accédez à l'Entrée de la tâche et configurez les champs d'entrée affichés à l'aide du tableau Paramètres d'entrée de la tâche suivant.
Les modifications apportées aux champs d'entrée sont enregistrées automatiquement.

Paramètres de saisie des tâches

Le tableau suivant décrit les paramètres d'entrée de la tâche Vertex AI – Prédiction :

Propriété	Type de données	Description
Région	String	Emplacement du point de terminaison du modèle. Par exemple : `us` - États-Unis.
ProjectsId	Chaîne	L'ID de votre projet Google Cloud.
Endpoint	String	Nom du point de terminaison demandé pour diffuser la prédiction.
Demande	JSON	Consultez la section Structure JSON de requête.

Résultat de la tâche

La tâche Vertex AI – Prédiction renvoie une réponse contenant la prédiction.

Stratégie de traitement des erreurs

Une stratégie de traitement des erreurs d'une tâche spécifie l'action à effectuer si celle-ci échoue en raison d'une erreur temporaire. Pour en savoir plus sur l'utilisation et les différents types de stratégies de traitement des erreurs, consultez la page Stratégies de traitement des erreurs.

Étapes suivantes

Ajoutez des arêtes et conditions d'arêtes.
Testez et publiez votre intégration.
Configurez un déclencheur.
Ajoutez une tâche de mappage de données.
Consultez toutes les tâches des services Google Cloud.