Vertex AI est une plate-forme de machine learning (ML) qui vous permet d'entraîner, de régler et de déployer des modèles de ML et des applications d'IA. Pour ajouter des fonctionnalités d'IA générative à un service Cloud Run existant, vous pouvez utiliser Vertex AI pour accéder à des modèles d'IA générative tels que Gemini, PaLM, Imagen, Codey, et autres.
Ce guide explique comment utiliser les intégrations Cloud Run afin de configurer rapidement l'accès à Vertex AI pour votre service Cloud Run.
Avant de commencer
- Assurez-vous que le service Cloud Run avec lequel vous effectuez l'intégration est déjà déployé.
- Consultez la page des tarifs de Vertex AI. Les ressources individuelles utilisées dans l'intégration vous sont facturées.
Rôles requis
Pour utiliser les intégrations Cloud Run, vous ou votre administrateur devez attribuer des rôles IAM sur deux comptes principaux différents.
Cliquez ici pour afficher les rôles requis pour votre compte Google
Pour obtenir les autorisations nécessaires pour utiliser les intégrations Cloud Run, demandez à votre administrateur d'accorder à votre compte Google les rôles IAM suivants sur votre projet :
- Développeur Cloud Run (
roles/run.developer
) - Lecteur Compute (
roles/compute.viewer
) - Développeur d'intégrations sans serveur (
roles/runapps.developer
) - Opérateur d'intégrations sans serveur (
roles/runapps.operator
) - Utilisateur du compte de service (
roles/iam.serviceAccountUser
)
Cliquez ici pour afficher les rôles requis pour le compte de service
Pour déployer le service Cloud Run, vous pouvez utiliser le compte de service par défaut Compute Engine créé automatiquement ou spécifier un compte de service géré par l'utilisateur. Le compte de service doit disposer des rôles suivants :
- Développeur Cloud Run (
roles/run.developer
) - Rédacteur de bucket de journaux (
roles/logging.bucketWriter
) - Utilisateur du compte de service (
roles/iam.serviceAccountUser
) - Administrateur de l'espace de stockage (
roles/storage.admin
) - Administrateur de projet IAM (
roles/project.iamAdmin
)
Connecter un service à Vertex AI
Lorsque vous utilisez des intégrations Cloud Run pour vous connecter à Vertex AI, l'intégration effectue les opérations suivantes:
- Permet à l'API Vertex AI du service Cloud Run d'accéder aux modèles d'IA générative Vertex AI.
- Accorde à l'identité de service les rôles requis.
Vous pouvez créer l'intégration à l'aide de la console ou de la ligne de commande.
Console
Dans la console Google Cloud, accédez à la page Cloud Run.
Dans la liste des services, cliquez sur celui que vous souhaitez utiliser dans cette intégration.
Cliquez sur l'onglet Integrations (Intégrations).
Cliquez sur Ajouter une intégration.
Cliquez sur Vertex AI.
Utilisez le nom par défaut ou remplacez le nom par la valeur que vous souhaitez utiliser.
Si vous êtes invité à activer une liste d'API, cliquez sur Activer et attendez que l'activation soit effective.
Cliquez sur Envoyer et attendez que l'intégration soit terminée. Cette opération peut prendre jusqu'à une minute.
Ligne de commande
Installez la dernière version de Google Cloud CLI :
gcloud components update
Créez l'intégration :
gcloud beta run integrations create \ --type=vertex-genai \ --service=SERVICE \
Remplacez :
- SERVICE par le nom de votre service Cloud Run.
Vous pouvez également inclure l'option
--service-account=SERVICE_ACCOUNT_EMAIL
.Remplacez SERVICE_ACCOUNT_EMAIL par l'adresse e-mail du compte de service géré par l'utilisateur (
PROJECT_NUMBER-compute@developer.gserviceaccount.com
) utilisé pour déployer le service. Ne renseignez pas cette option si vous souhaitez utiliser le compte de service Compute par défaut (SERVICE_ACCOUNT_ID@PROJECT_ID.iam.gserviceaccount.com
).Pour continuer à utiliser le compte de service spécifié lors du déploiement des intégrations Cloud Run, exécutez la commande suivante :
gcloud config set runapps/deployment-service-account
Attendez jusqu'à une minute, au cours de laquelle votre service Cloud Run se voit accorder des autorisations nécessaires pour appeler l'API Vertex AI.
[vertex-genai] integration [vertex-genai-xxx] has been created successfully.
Vous pouvez vérifier l'état à l'aide de
gcloud beta run integrations describe
.
Afficher les intégrations Vertex AI
Pour afficher l'état actuel des intégrations Vertex AI pour votre service Cloud Run, procédez comme suit:
Console
Dans la console Google Cloud, accédez à la page Cloud Run.
Dans la liste des services, cliquez sur celui que vous souhaitez utiliser dans cette intégration.
Cliquez sur l'onglet Integrations (Intégrations).
Identifiez l'intégration Vertex AI qui vous intéresse, puis cliquez sur Afficher les détails.
Ligne de commande
Exécutez la commande suivante pour obtenir la liste des intégrations disponibles :
gcloud beta run integrations list
Choisissez un nom dans cette liste, et exécutez la commande suivante pour en afficher les détails :
gcloud beta run integrations describe INTEGRATION_NAME
Remplacez INTEGRATION_NAME par le nom de votre intégration de Vertex AI.
Supprimer des intégrations Vertex AI
La suppression d'une intégration entraîne également la suppression de toutes les ressources Google Cloud qui y sont associées, mais pas votre service Cloud Run.
Pour supprimer une intégration de Vertex AI de votre service Cloud Run, procédez comme suit:
Console
Dans la console Google Cloud, accédez à la page Cloud Run.
Cliquez sur le service pour lequel vous souhaitez supprimer une intégration.
Cliquez sur l'onglet Integrations (Intégrations).
Identifiez l'intégration Vertex AI qui vous intéresse, cliquez sur l'icône représentant des points de suspension à droite de l'intégration, puis cliquez sur Supprimer.
Ligne de commande
Exécutez la commande suivante pour obtenir la liste des intégrations disponibles :
gcloud beta run integrations list
Choisissez un nom dans cette liste, et exécutez la commande suivante pour supprimer cette intégration :
gcloud beta run integrations delete INTEGRATION_NAME
Remplacez :
- INTEGRATION_NAME par le nom de votre intégration de Vertex AI.
Vous pouvez également utiliser les options suivantes :
Option Description --service-account
Adresse e-mail du compte de service géré par l'utilisateur utilisé pour effectuer l'opération de suppression.
Accéder aux modèles d'IA générative de Vertex AI dans votre code
Une fois l'intégration terminée, vous pouvez envoyer des requêtes aux API de modèles Vertex AI et utiliser Vertex AI Studio pour tester rapidement et personnaliser des modèles d'IA générative dans votre application.
Limites
Les intégrations Cloud Run ne sont disponibles que dans certaines régions. Si vous devez utiliser une région non compatible avec les intégrations Cloud Run, consultez la page Emplacements Vertex AI.