Se connecter aux modèles d'IA générative de Vertex AI

Vertex AI est une plate-forme de machine learning (ML) qui vous permet d'entraîner, de régler et de déployer des modèles de ML et des applications d'IA. Pour ajouter des fonctionnalités d'IA générative à un service Cloud Run existant, vous pouvez utiliser Vertex AI pour accéder à des modèles d'IA générative tels que Gemini, PaLM, Imagen, Codey, et autres.

Ce guide explique comment utiliser les intégrations Cloud Run afin de configurer rapidement l'accès à Vertex AI pour votre service Cloud Run.

Avant de commencer

  • Assurez-vous que le service Cloud Run avec lequel vous effectuez l'intégration est déjà déployé.
  • Consultez la page des tarifs de Vertex AI. Les ressources individuelles utilisées dans l'intégration vous sont facturées.

Rôles requis

Pour utiliser les intégrations Cloud Run, vous ou votre administrateur devez attribuer des rôles IAM sur deux comptes principaux différents.

Cliquez ici pour afficher les rôles requis pour votre compte Google

Pour obtenir les autorisations nécessaires pour utiliser les intégrations Cloud Run, demandez à votre administrateur d'accorder à votre compte Google les rôles IAM suivants sur votre projet :

Cliquez ici pour afficher les rôles requis pour le compte de service

Pour déployer le service Cloud Run, vous pouvez utiliser le compte de service par défaut Compute Engine créé automatiquement ou spécifier un compte de service géré par l'utilisateur. Le compte de service doit disposer des rôles suivants :

Connecter un service à Vertex AI

Lorsque vous utilisez des intégrations Cloud Run pour vous connecter à Vertex AI, l'intégration effectue les opérations suivantes:

  • Permet à l'API Vertex AI du service Cloud Run d'accéder aux modèles d'IA générative Vertex AI.
  • Accorde à l'identité de service les rôles requis.

Vous pouvez créer l'intégration à l'aide de la console ou de la ligne de commande.

Console

  1. Dans la console Google Cloud, accédez à la page Cloud Run.

    Accédez à Cloud Run

  2. Dans la liste des services, cliquez sur celui que vous souhaitez utiliser dans cette intégration.

  3. Cliquez sur l'onglet Integrations (Intégrations).

  4. Cliquez sur Ajouter une intégration.

  5. Cliquez sur Vertex AI.

  6. Utilisez le nom par défaut ou remplacez le nom par la valeur que vous souhaitez utiliser.

  7. Si vous êtes invité à activer une liste d'API, cliquez sur Activer et attendez que l'activation soit effective.

  8. Cliquez sur Envoyer et attendez que l'intégration soit terminée. Cette opération peut prendre jusqu'à une minute.

Ligne de commande

  1. Installez la dernière version de Google Cloud CLI :

    gcloud components update
  2. Créez l'intégration :

    gcloud beta run integrations create \
    --type=vertex-genai \
    --service=SERVICE \

    Remplacez :

    • SERVICE par le nom de votre service Cloud Run.

    Vous pouvez également inclure l'option --service-account=SERVICE_ACCOUNT_EMAIL.

    • Remplacez SERVICE_ACCOUNT_EMAIL par l'adresse e-mail du compte de service géré par l'utilisateur (PROJECT_NUMBER-compute@developer.gserviceaccount.com) utilisé pour déployer le service. Ne renseignez pas cette option si vous souhaitez utiliser le compte de service Compute par défaut (SERVICE_ACCOUNT_ID@PROJECT_ID.iam.gserviceaccount.com).

      Pour continuer à utiliser le compte de service spécifié lors du déploiement des intégrations Cloud Run, exécutez la commande suivante :

      gcloud config set runapps/deployment-service-account
  3. Attendez jusqu'à une minute, au cours de laquelle votre service Cloud Run se voit accorder des autorisations nécessaires pour appeler l'API Vertex AI.

    [vertex-genai] integration [vertex-genai-xxx] has been created successfully.

    Vous pouvez vérifier l'état à l'aide de gcloud beta run integrations describe.

Afficher les intégrations Vertex AI

Pour afficher l'état actuel des intégrations Vertex AI pour votre service Cloud Run, procédez comme suit:

Console

  1. Dans la console Google Cloud, accédez à la page Cloud Run.

    Accédez à Cloud Run

  2. Dans la liste des services, cliquez sur celui que vous souhaitez utiliser dans cette intégration.

  3. Cliquez sur l'onglet Integrations (Intégrations).

  4. Identifiez l'intégration Vertex AI qui vous intéresse, puis cliquez sur Afficher les détails.

Ligne de commande

  1. Exécutez la commande suivante pour obtenir la liste des intégrations disponibles :

    gcloud beta run integrations list
  2. Choisissez un nom dans cette liste, et exécutez la commande suivante pour en afficher les détails :

    gcloud beta run integrations describe INTEGRATION_NAME

    Remplacez INTEGRATION_NAME par le nom de votre intégration de Vertex AI.

Supprimer des intégrations Vertex AI

La suppression d'une intégration entraîne également la suppression de toutes les ressources Google Cloud qui y sont associées, mais pas votre service Cloud Run.

Pour supprimer une intégration de Vertex AI de votre service Cloud Run, procédez comme suit:

Console

  1. Dans la console Google Cloud, accédez à la page Cloud Run.

    Accédez à Cloud Run

  2. Cliquez sur le service pour lequel vous souhaitez supprimer une intégration.

  3. Cliquez sur l'onglet Integrations (Intégrations).

  4. Identifiez l'intégration Vertex AI qui vous intéresse, cliquez sur l'icône représentant des points de suspension à droite de l'intégration, puis cliquez sur Supprimer.

Ligne de commande

  1. Exécutez la commande suivante pour obtenir la liste des intégrations disponibles :

    gcloud beta run integrations list
  2. Choisissez un nom dans cette liste, et exécutez la commande suivante pour supprimer cette intégration :

    gcloud beta run integrations delete INTEGRATION_NAME

    Remplacez :

    • INTEGRATION_NAME par le nom de votre intégration de Vertex AI.

    Vous pouvez également utiliser les options suivantes :

    Option Description
    --service-account Adresse e-mail du compte de service géré par l'utilisateur utilisé pour effectuer l'opération de suppression.

Accéder aux modèles d'IA générative de Vertex AI dans votre code

Une fois l'intégration terminée, vous pouvez envoyer des requêtes aux API de modèles Vertex AI et utiliser Vertex AI Studio pour tester rapidement et personnaliser des modèles d'IA générative dans votre application.

Limites

Les intégrations Cloud Run ne sont disponibles que dans certaines régions. Si vous devez utiliser une région non compatible avec les intégrations Cloud Run, consultez la page Emplacements Vertex AI.