Tâche Vertex AI – Prédiction

La tâche Vertex AI – Prédiction vous permet d'effectuer une prédiction en ligne. Pour les prédictions en ligne, des requêtes synchrones sont adressées à un point de terminaison du modèle. Vous pouvez utiliser les prédictions en ligne pour effectuer des requêtes en réponse à des entrées d'application ou lorsque vous avez besoin d'inférences en temps opportun.

Vertex AI est un service Google Cloud qui vous permet d'entraîner et de déployer des modèles de ML et des applications d'IA, et de personnaliser des grands modèles de langage (LLM) pour une utilisation dans vos applications basées sur l'IA.

Avant de commencer

Assurez-vous d'effectuer les tâches suivantes dans votre projet Google Cloud avant de configurer la tâche Vertex AI – Prédiction :

  1. Activez l'API Vertex AI (aiplatform.googleapis.com).

    Activer l'API Vertex AI

  2. Déployer la ressource "model" sur la ressource "endpoint".
  3. Créez un profil d'authentification. Apigee Integration se connecte à un point de terminaison d'authentification à l'aide d'un profil d'authentification pour la tâche Vertex AI – Prédiction.
  4. Assurez-vous que VPC Service Controls n'est PAS configuré pour Apigee Integration dans votre projet Google Cloud.

Configurer la tâche Vertex AI – Prédiction

  1. Dans l'interface utilisateur Apigee, sélectionnez votre organisation Apigee.
  2. Cliquez sur Développer > Intégrations.
  3. Sélectionnez une intégration existante ou créez-en une en cliquant sur Créer une intégration.

    Si vous créez une intégration :

    1. Saisissez un nom et une description dans la boîte de dialogue Créer une intégration.
    2. Dans la liste des régions compatibles, sélectionnez une région pour l'intégration.
    3. Cliquez sur Créer.

    La page de conception d'intégration s'affiche.

  4. Dans la barre de navigation de la page de conception d'intégration, cliquez sur +Ajouter une tâche ou un déclencheur > Tâches pour afficher la liste des tâches disponibles.
  5. Cliquez sur l'élément Vertex AI – Prédiction et placez-le dans le concepteur d'intégration.
  6. Cliquez sur l'élément Vertex AI – Prédiction dans le concepteur pour afficher le volet de configuration de la tâche Vertex AI – Predict.
  7. Accédez à Authentification, puis sélectionnez un profil d'authentification existant que vous souhaitez utiliser.

    Facultatif. Si vous n'avez pas créé de profil d'authentification avant de configurer la tâche, cliquez sur + Nouveau profil d'authentification et suivez les étapes mentionnées dans la section Créer un profil d'authentification.

  8. Accédez à l'Entrée de la tâche et configurez les champs d'entrée affichés à l'aide du tableau Paramètres d'entrée de la tâche suivant.

    Les modifications apportées aux champs d'entrée sont enregistrées automatiquement.

Paramètres de saisie des tâches

Le tableau suivant décrit les paramètres d'entrée de la tâche Vertex AI – Prédiction :

Propriété Type de données Description
Région String Emplacement du point de terminaison du modèle. Par exemple : us - États-Unis.
ProjectsId Chaîne L'ID de votre projet Google Cloud.
EndpointString Nom du point de terminaison demandé pour diffuser la prédiction.
Demande JSON Consultez la section Structure JSON de requête.

Résultat de la tâche

La tâche Vertex AI – Prédiction renvoie une réponse contenant la prédiction.

Stratégie de traitement des erreurs

Une stratégie de traitement des erreurs d'une tâche spécifie l'action à effectuer si celle-ci échoue en raison d'une erreur temporaire. Pour en savoir plus sur l'utilisation et les différents types de stratégies de traitement des erreurs, consultez la page Stratégies de traitement des erreurs.

Étapes suivantes

  1. Ajoutez des arêtes et conditions d'arêtes.
  2. Testez et publiez votre intégration.
  3. Configurez un déclencheur.
  4. Ajoutez une tâche de mappage de données.
  5. Consultez toutes les tâches des services Google Cloud.