Guide de démarrage rapide: Déployer votre requête Vertex AI Studio en tant qu'application Web

Dans Vertex AI Studio, vous pouvez concevoir et itérer vos requêtes, et comparer les résultats de différentes configurations et de différents modèles. Une fois que vous avez terminé de concevoir votre requête, vous pouvez la déployer en tant qu'application Web pour la partager avec vos collaborateurs ou vos utilisateurs cibles afin qu'ils puissent tester l'application Web. L'application Web est hébergée sur Cloud Run et est disponible en dehors de la console Google Cloud .

Dans ce guide de démarrage rapide, vous allez :

  • Créer une requête avec des variables de requête
  • Déployer votre prompt en tant qu'application Web
  • Surveiller la progression du déploiement et tester l'application déployée
  • Mettre à jour et redéployer votre requête
  • Tester l'envoi de requêtes avec des fonctionnalités multimodales

Avant de commencer

Si vous n'avez jamais utilisé Vertex AI Studio, vous pouvez suivre un autre guide de démarrage rapide ou le cours Google Cloud Skills Boost pour découvrir les bases de Vertex AI Studio. Pour suivre ce guide, vous devez disposer des éléments suivants :

  1. Un projet Google Cloud créé avec la facturation activée
  2. API Vertex AI activée

Autorisations supplémentaires requises

En plus des autorisations existantes pour utiliser Vertex AI Studio, vous devez disposer des autorisations suivantes pour déployer votre requête :

Action Autorisations requises Objectif
Activer des API supplémentaires serviceusage.services.enable Activez les API suivantes :
  • API Cloud Run Admin (run.googleapis.com)
  • API Identity-Aware Proxy (iap.googleapis.com)
  • API Artifact Registry (artifactregistry.googleapis.com)
  • API Cloud Build (cloudbuild.googleapis.com)
  • API Cloud Logging (logging.googleapis.com)
Attribuer des autorisations aux comptes de service resourcemanager.projects.setIamPolicy Attribuez les rôles suivants au compte de service Compute Engine par défaut :
Déployer des autorisations spécifiques
  • storage.buckets.create
  • run.services.create
  • artifactregistry.repositories.create
  • run.services.setIamPolicy
Lors du déploiement, un ensemble de codes sources sera importé dans Cloud Storage, puis déployé sur Cloud Run avec un nouveau service créé. Le artifactregistry.repositories.create est nécessaire pour créer un dépôt pour l'image de conteneur. Le run.services.setIamPolicy est nécessaire pour rendre le service accessible au public.

Si vous êtes le propriétaire de votre projet, vous n'avez pas besoin d'effectuer d'actions supplémentaires, mais suivez les guides dans Vertex AI Studio. Si vous n'êtes pas le propriétaire de votre projet, demandez à l'administrateur de votre projet d'effectuer les deux premières actions, puis de vous accorder les rôles Éditeur (roles/editor) et Administrateur Cloud Run (roles/run.admin).

Créer une requête avec des variables de requête

Accédez à la page de création de requêtes de Vertex AI Studio, puis cliquez sur Ajouter une variable  dans le champ de saisie de la requête.

Dans la boîte de dialogue Gérer les variables de prompt, saisissez un nom de variable et attribuez-lui une valeur. Cliquez ensuite sur Appliquer.

Boîte de dialogue "Gérer les variables de prompt"

Dans la zone de saisie de la requête, rédigez la requête à l'aide de la variable, puis ajustez les autres paramètres. Par exemple, vous pouvez activer l'ancrage avec la recherche Google et définir "Toujours obtenir la météo actuelle sur le Web" comme instruction système.

Déployer votre prompt en tant qu'application Web

Pour déployer votre requête en tant qu'application Web, cliquez sur le bouton Compiler avec du code en haut à droite. Cliquez ensuite sur Déployer en tant qu'application.

Cliquez sur le bouton "Créer avec du code", puis sur "Déployer en tant qu'application".

Enregistrer le prompt

La boîte de dialogue d'enregistrement du prompt s'affiche, car l'enregistrement est obligatoire avant de pouvoir déployer un prompt. La boîte de dialogue de déploiement s'ouvrira automatiquement une fois le prompt enregistré.

Enregistrez d'abord la requête avant de la déployer.

Activer les API pour le premier déploiement et accorder des autorisations

  1. Une fois l'invite enregistrée, le processus de déploiement se poursuit. Si c'est votre premier déploiement, une boîte de dialogue s'affiche pour vous inviter à activer les API requises. Cliquez sur Activer les API requises.
  2. Une fois les API activées, la boîte de dialogue Créer une application Web s'affiche. Vous pouvez choisir Authentification requise (via Identity-Aware Proxy) ou Autoriser l'accès public.
    • Si vous choisissez l'authentification requise, suivez le guide pour accorder l'accès (y compris à vous-même).
    • Si vous choisissez d'autoriser l'accès public, cela signifie que n'importe qui peut accéder à l'application. Par conséquent, n'incluez pas d'informations sensibles ou permettant d'identifier personnellement l'utilisateur dans votre requête. Cochez la case Je comprends que cette application sera déployée publiquement pour confirmer.
  3. Cliquez sur Créer une application pour lancer le déploiement.
  4. Si c'est votre premier déploiement, une autre boîte de dialogue s'affiche pour vous demander d'accorder les rôles requis au compte de service. Cliquez sur Accorder tout pour continuer.

Si c'est votre premier déploiement, une autre boîte de dialogue s'affiche pour vous demander d'attribuer les rôles requis au compte de service. Cliquez sur Accorder tout pour continuer.

Début du déploiement

Vertex AI Studio crée un fichier ZIP contenant le code source de l'application Web et l'importe dans un bucket Cloud Storage. Une fois le déploiement lancé, la boîte de dialogue Gérer l'application Web s'affiche et fournit des informations sur votre déploiement, comme le nom de votre application, la date de son dernier déploiement, son état de déploiement, etc.

Boîte de dialogue "Gérer l'application"

Surveiller l'état du déploiement

Le déploiement prend deux à trois minutes. Son état s'affiche dans la colonne État de la boîte de dialogue Gérer l'application Web. Si vous fermez la boîte de dialogue Gérer l'application Web, vous pouvez la rouvrir à partir du menu sous le bouton Compiler avec du code.

Une fois le déploiement terminé, la colonne d'état passe à Prêt et le bouton Ouvrir s'affiche à côté du nom de l'application.

Le bouton "Ouvrir l'application" s'affiche à côté du nom de l'application.

Contrôle des accès et clé secrète

Votre application Web est déployée avec le contrôle des accès Autoriser l'accès non authentifié activé par défaut. Pour la désactiver, cliquez sur le bouton en forme de crayon . Pour en savoir plus, consultez la section Désactiver l'accès public.

Pour assurer une protection de base, l'application Web exige qu'une clé secrète soit ajoutée à l'URL pour envoyer la requête. Vous trouverez la clé secrète dans la colonne Secret Key (Clé secrète). Si vous ouvrez l'application Web à partir de Vertex AI Studio, la clé sera ajoutée à l'URL pour vous.

Ouvrez l'application Web et envoyez la requête.

Cliquez sur Ouvrir dans la boîte de dialogue Gérer l'application Web pour accéder à l'application déployée. L'application doit être ouverte avec la clé secrète ajoutée à l'URL au format ?key=SECRET_KEY.

Ouvrez l'application Web depuis la boîte de dialogue "Gérer l'application". La clé secrète est ajoutée à l'URL.

Saisissez une valeur pour la variable, puis cliquez sur Envoyer. Vous devriez pouvoir voir les résultats à droite.

Envoyer la requête depuis l'application Web

Ouvrez l'application Web à partir du menu du bouton "Compiler avec du code".

Si votre application Web est prête, vous pouvez également l'ouvrir à partir du menu du bouton Compiler avec du code.

Ouvrez l'application à partir du menu du bouton "Compiler avec du code".

Cloud Run est un service sans serveur, ce qui signifie que le conteneur de l'application sera arrêté s'il n'est pas utilisé activement. Par conséquent, l'application Web peut parfois mettre quelques secondes à se charger, ou une demande peut ne pas fonctionner si vous avez laissé l'application Web inactive trop longtemps. Actualisez la page pour tenter de résoudre le problème.

Surveiller l'état depuis la cloche de notification

Vous pouvez également surveiller l'état dans le menu Notifications en cliquant sur l'icône en forme de cloche. L'animation de chargement de l'icône en forme de cloche s'arrête et un cercle vert s'affiche si le déploiement est terminé.

Surveiller l'état depuis la cloche de notification

Si vous cliquez sur la notification, vous serez redirigé vers la page Cloud Run. L'URL de la page Cloud Run ne contient pas la clé secrète. Vous devrez l'ajouter manuellement au format ?key=SECRET_KEY.

Le lien vers l'application sur la page Cloud Run ne comporte pas la clé ajoutée

Mettre à jour et redéployer votre requête

Vous pouvez modifier davantage votre requête dans Vertex AI Studio et la transformer en conversation. Cliquez ensuite sur le bouton Créer avec du code, puis sur Gérer l'application pour ouvrir la boîte de dialogue Gérer l'application Web. Cliquez sur Mettre à jour l'application pour redéployer votre application Web avec la requête mise à jour.

Une boîte de dialogue de confirmation s'affiche. Il vous indique que si vous redéployez l'application Web, vous perdrez toutes les modifications que vous y avez apportées en dehors de Vertex AI Studio (par exemple, dans l'éditeur de code source Cloud Run). Cliquez sur Confirmer pour continuer.

La boîte de dialogue Gérer l'application Web s'affiche à nouveau. Le processus est semblable au déploiement initial. Vous pouvez suivre la progression de la même manière que pour le premier déploiement.

Une fois la mise à jour terminée, vous pouvez rouvrir l'application Web. L'interface utilisateur de la conversation s'affiche avec la variable d'invite. Renseignez la valeur et saisissez du contenu non vide pour poursuivre la conversation.

L'interface utilisateur de l'application mise à jour comporte une interface utilisateur de chat.

Insérer du contenu multimodal

Vous pouvez insérer des entrées telles que des images, des vidéos, des fichiers audio et des documents dans l'interface utilisateur de conversation. Les entrées acceptées dépendent du modèle sélectionné pour la requête. Consultez la documentation sur la compatibilité multimodale pour chaque modèle.

Pour insérer un fichier, cliquez sur le bouton en forme de trombone  dans le champ de saisie de la conversation.

Insérer des entrées multimodales

Vous pourrez interagir avec le modèle à l'aide des entrées que vous fournissez.

Interagir avec le modèle à l'aide des entrées multimodales

Informations supplémentaires

Une fois que vous êtes familiarisé avec le processus de déploiement, vous pouvez envisager les actions suivantes.

Modifier le code source dans Cloud Run

Si vous souhaitez personnaliser l'application Web, vous pouvez modifier le code source dans Cloud Run. Ouvrez la page du code source Cloud Run à partir de la boîte de dialogue Gérer l'application Web en cliquant sur le bouton  Plus à la fin de la ligne. ouvrir l'éditeur de code Open Source depuis la boîte de dialogue "Gérer l'application Web"

Vous pouvez également accéder à la page de sécurité depuis l'application Web en cliquant sur le lien Éditeur de code source.

Sur la page du code source Cloud Run, cliquez sur Modifier la source pour passer en mode édition. Lorsque vous avez terminé, cliquez sur Enregistrer et redéployer.

Une fois le redéploiement terminé, vous devez ouvrir l'application depuis Vertex AI Studio. Vous pouvez accéder à la page Vertex AI Studio en cliquant sur le lien du badge Déployé depuis Vertex AI.

Accorder l'accès

Pour accorder aux utilisateurs ou aux groupes l'accès à l'application, procédez comme suit :

  1. Ouvrez la boîte de dialogue Gérer l'application Web.
  2. Cliquez sur l'icône en forme de crayon  dans la colonne Contrôle d'accès. La page sur la sécurité de Cloud Run s'ouvre dans un nouvel onglet.
  3. Sur la page de sécurité Cloud Run, recherchez la case à cocher Identity-Aware Proxy (IAP). Assurez-vous qu'elle est cochée, puis cliquez sur Modifier la règle.
  4. Une sous-tâche s'affiche pour vous permettre de modifier l'accès. Saisissez les adresses e-mail des utilisateurs ou des groupes dans le champ Principal. Si vous êtes un utilisateur d'une organisation, vous ne pouvez ajouter que des utilisateurs de la même organisation.
    Sous-tâche pour modifier les achats via l'application
  5. Laissez le champ des niveaux d'accès vide.
  6. Cliquez sur Enregistrer.
  7. Une fois la sous-tâche fermée, cliquez à nouveau sur Enregistrer sur la page Cloud Run.
    Enregistrer à nouveau dans l'UI Cloud Run

Désactiver l'accès public

Lorsque vous n'avez plus besoin que l'application Web soit accessible au public, vous pouvez la désactiver dans Cloud Run. Ouvrez la boîte de dialogue Gérer l'application Web, puis cliquez sur l'icône en forme de crayon  dans la colonne Contrôle des accès. La page sur la sécurité de Cloud Run s'ouvre dans un nouvel onglet.

Vous pouvez également accéder à la page de sécurité depuis l'application Web en cliquant sur le lien Paramètres de sécurité.

Sur la page "Sécurité" du service Cloud Run correspondant à votre application Web, cochez la case Utiliser Cloud IAM pour authentifier les requêtes entrantes et sélectionnez Authentification requise. Cliquez sur Enregistrer.

Votre application Web ne sera alors plus accessible via l'URL. Si vous essayez d'y accéder, la page Erreur : Accès refusé s'affiche.

Réactiver l'accès public

Si vous souhaitez rétablir l'accès public, décochez la case Utiliser Cloud IAM pour authentifier les requêtes entrantes et enregistrez. Si vous choisissez l'option Autoriser les appels non authentifiés, elle ne fonctionnera pas si votre projet se trouve dans une organisation. Pour en savoir plus, consultez Authentification dans Cloud Run.

Configurer l'accès local pour le développement

Le contrôle des accès n'est pas encore disponible dans la version Preview publique. Par conséquent, une fois que vous avez désactivé l'accès public, la seule façon d'accéder à l'application Web est de configurer un proxy local. Pour ce faire, vous pouvez utiliser les commandes gcloud. Tout d'abord, ouvrez Cloud Shell en cliquant sur l'icône de terminal  en haut à droite de la console  Google Cloud . Vous serez invité à autoriser Cloud Shell. Cliquez sur Autoriser pour continuer.

Une fois l'opération terminée, ouvrez la boîte de dialogue Gérer l'application Web et cliquez sur le bouton d'icône Plus  à la fin de la ligne pour afficher d'autres actions. Cliquez sur Configurer l'accès local via Cloud Shell. Obtenir la commande de configuration de l'accès local à partir de la boîte de dialogue "Gérer l'application Web"

Une commande est ajoutée à votre Cloud Shell. Appuyez sur Entrée et attendez la fin de l'impression. Cliquez sur le lien dans la ligne commençant par Click on the link to preview. Vous pourrez consulter votre application. Ce lien ne fonctionne que lorsque la commande gcloud est en cours d'exécution. Lien d'accès local dans Cloud Shell

Problèmes courants

Erreur d'authentification : aucune clé secrète

Si l'erreur suivante s'affiche, cela signifie qu'aucune clé secrète n'est ajoutée à l'URL. Suivez les instructions pour ouvrir l'application Web depuis Vertex AI Studio, ou copiez la clé secrète depuis la boîte de dialogue Gérer l'application et ajoutez-la à l'URL au format ?key=SECRET_KEY.

Erreur en l'absence de clé secrète

Erreur d'authentification : clé secrète incorrecte

L'erreur suivante signifie que la clé ajoutée à l'URL n'est pas valide. La clé secrète est unique à chaque requête. Si vous disposez d'une clé secrète provenant d'une autre invite, elle ne fonctionnera pas. Suivez les instructions pour ouvrir correctement l'application Web.

Erreur pour clé non valide

400 Argument non valide : entrée vide

L'erreur suivante se produit lorsque vous avez des entrées dans la variable d'invite, mais que le chat est vide. Un message d'erreur 400 s'affiche alors. Pour résoudre ce problème, saisissez n'importe quel texte non vide, puis renvoyez le formulaire.

Erreur pour contenu vide

400 Argument non valide : le type MIME n'est pas accepté

Si vous choisissez un type de fichier non compatible avec le modèle, une erreur 400 s'affiche. C'est normal. Vous devrez utiliser d'autres types de fichiers compatibles avec le modèle. Consultez la documentation sur la compatibilité multimodale pour chaque modèle.

Erreur pour les types MIME non compatibles

Étapes suivantes