Dans Vertex AI Studio, vous pouvez concevoir et itérer vos requêtes, et comparer les résultats de différentes configurations et de différents modèles. Une fois que vous avez terminé de concevoir votre requête, vous pouvez la déployer en tant qu'application Web pour la partager avec vos collaborateurs ou vos utilisateurs cibles afin qu'ils puissent tester l'application Web. L'application Web est hébergée sur Cloud Run et est disponible en dehors de la console Google Cloud .
Dans ce guide de démarrage rapide, vous allez :
- Créer une requête avec des variables de requête
- Déployer votre prompt en tant qu'application Web
- Surveiller la progression du déploiement et tester l'application déployée
- Mettre à jour et redéployer votre requête
- Tester l'envoi de requêtes avec des fonctionnalités multimodales
Avant de commencer
Si vous n'avez jamais utilisé Vertex AI Studio, vous pouvez suivre un autre guide de démarrage rapide ou le cours Google Cloud Skills Boost pour découvrir les bases de Vertex AI Studio. Pour suivre ce guide, vous devez disposer des éléments suivants :
- Un projet Google Cloud créé avec la facturation activée
- API Vertex AI activée
Autorisations supplémentaires requises
En plus des autorisations existantes pour utiliser Vertex AI Studio, vous devez disposer des autorisations suivantes pour déployer votre requête :
Action | Autorisations requises | Objectif |
---|---|---|
Activer des API supplémentaires | serviceusage.services.enable |
Activez les API suivantes :
|
Attribuer des autorisations aux comptes de service | resourcemanager.projects.setIamPolicy |
Attribuez les rôles suivants au
compte de service Compute Engine par défaut :
|
Déployer des autorisations spécifiques |
|
Lors du déploiement, un ensemble de codes sources sera importé dans Cloud Storage, puis déployé sur Cloud Run avec un nouveau service créé. Le artifactregistry.repositories.create
est nécessaire pour créer un dépôt pour l'image de conteneur.
Le run.services.setIamPolicy est nécessaire pour rendre le service accessible au public.
|
Si vous êtes le propriétaire de votre projet, vous n'avez pas besoin d'effectuer d'actions supplémentaires, mais suivez les guides dans Vertex AI Studio. Si vous n'êtes pas le propriétaire de votre projet, demandez à l'administrateur de votre projet d'effectuer les deux premières actions, puis de vous accorder les rôles Éditeur (roles/editor
) et Administrateur Cloud Run (roles/run.admin
).
Créer une requête avec des variables de requête
Accédez à la page de création de requêtes de Vertex AI Studio, puis cliquez sur Ajouter une variable dans le champ de saisie de la requête.
Dans la boîte de dialogue Gérer les variables de prompt, saisissez un nom de variable et attribuez-lui une valeur. Cliquez ensuite sur Appliquer.
Dans la zone de saisie de la requête, rédigez la requête à l'aide de la variable, puis ajustez les autres paramètres. Par exemple, vous pouvez activer l'ancrage avec la recherche Google et définir "Toujours obtenir la météo actuelle sur le Web" comme instruction système.
Déployer votre prompt en tant qu'application Web
Pour déployer votre requête en tant qu'application Web, cliquez sur le bouton Compiler avec du code en haut à droite. Cliquez ensuite sur Déployer en tant qu'application.
Enregistrer le prompt
La boîte de dialogue d'enregistrement du prompt s'affiche, car l'enregistrement est obligatoire avant de pouvoir déployer un prompt. La boîte de dialogue de déploiement s'ouvrira automatiquement une fois le prompt enregistré.
Activer les API pour le premier déploiement et accorder des autorisations
- Une fois l'invite enregistrée, le processus de déploiement se poursuit. Si c'est votre premier déploiement, une boîte de dialogue s'affiche pour vous inviter à activer les API requises. Cliquez sur Activer les API requises.
-
Une fois les API activées, la boîte de dialogue Créer une application Web s'affiche. Vous pouvez choisir Authentification requise (via Identity-Aware Proxy) ou Autoriser l'accès public.
- Si vous choisissez l'authentification requise, suivez le guide pour accorder l'accès (y compris à vous-même).
- Si vous choisissez d'autoriser l'accès public, cela signifie que n'importe qui peut accéder à l'application. Par conséquent, n'incluez pas d'informations sensibles ou permettant d'identifier personnellement l'utilisateur dans votre requête. Cochez la case Je comprends que cette application sera déployée publiquement pour confirmer.
- Cliquez sur Créer une application pour lancer le déploiement.
- Si c'est votre premier déploiement, une autre boîte de dialogue s'affiche pour vous demander d'accorder les rôles requis au compte de service. Cliquez sur Accorder tout pour continuer.
Si c'est votre premier déploiement, une autre boîte de dialogue s'affiche pour vous demander d'attribuer les rôles requis au compte de service. Cliquez sur Accorder tout pour continuer.
Début du déploiement
Vertex AI Studio crée un fichier ZIP contenant le code source de l'application Web et l'importe dans un bucket Cloud Storage. Une fois le déploiement lancé, la boîte de dialogue Gérer l'application Web s'affiche et fournit des informations sur votre déploiement, comme le nom de votre application, la date de son dernier déploiement, son état de déploiement, etc.
Surveiller l'état du déploiement
Le déploiement prend deux à trois minutes. Son état s'affiche dans la colonne État de la boîte de dialogue Gérer l'application Web. Si vous fermez la boîte de dialogue Gérer l'application Web, vous pouvez la rouvrir à partir du menu sous le bouton Compiler avec du code.
Une fois le déploiement terminé, la colonne d'état passe à Prêt et le bouton Ouvrir s'affiche à côté du nom de l'application.
Contrôle des accès et clé secrète
Votre application Web est déployée avec le contrôle des accès Autoriser l'accès non authentifié activé par défaut. Pour la désactiver, cliquez sur le bouton en forme de crayon Désactiver l'accès public.
. Pour en savoir plus, consultez la sectionPour assurer une protection de base, l'application Web exige qu'une clé secrète soit ajoutée à l'URL pour envoyer la requête. Vous trouverez la clé secrète dans la colonne Secret Key (Clé secrète). Si vous ouvrez l'application Web à partir de Vertex AI Studio, la clé sera ajoutée à l'URL pour vous.
Ouvrez l'application Web et envoyez la requête.
Cliquez sur Ouvrir dans la boîte de dialogue Gérer l'application Web pour accéder à l'application déployée. L'application doit être ouverte avec la clé secrète ajoutée à l'URL au format ?key=SECRET_KEY
.
Saisissez une valeur pour la variable, puis cliquez sur Envoyer. Vous devriez pouvoir voir les résultats à droite.
Ouvrez l'application Web à partir du menu du bouton "Compiler avec du code".
Si votre application Web est prête, vous pouvez également l'ouvrir à partir du menu du bouton Compiler avec du code.
Cloud Run est un service sans serveur, ce qui signifie que le conteneur de l'application sera arrêté s'il n'est pas utilisé activement. Par conséquent, l'application Web peut parfois mettre quelques secondes à se charger, ou une demande peut ne pas fonctionner si vous avez laissé l'application Web inactive trop longtemps. Actualisez la page pour tenter de résoudre le problème.
Surveiller l'état depuis la cloche de notification
Vous pouvez également surveiller l'état dans le menu Notifications en cliquant sur l'icône en forme de cloche. L'animation de chargement de l'icône en forme de cloche s'arrête et un cercle vert s'affiche si le déploiement est terminé.
Si vous cliquez sur la notification, vous serez redirigé vers la page Cloud Run. L'URL de la page Cloud Run ne contient pas la clé secrète. Vous devrez l'ajouter manuellement au format ?key=SECRET_KEY
.
Mettre à jour et redéployer votre requête
Vous pouvez modifier davantage votre requête dans Vertex AI Studio et la transformer en conversation. Cliquez ensuite sur le bouton Créer avec du code, puis sur Gérer l'application pour ouvrir la boîte de dialogue Gérer l'application Web. Cliquez sur Mettre à jour l'application pour redéployer votre application Web avec la requête mise à jour.
Une boîte de dialogue de confirmation s'affiche. Il vous indique que si vous redéployez l'application Web, vous perdrez toutes les modifications que vous y avez apportées en dehors de Vertex AI Studio (par exemple, dans l'éditeur de code source Cloud Run). Cliquez sur Confirmer pour continuer.
La boîte de dialogue Gérer l'application Web s'affiche à nouveau. Le processus est semblable au déploiement initial. Vous pouvez suivre la progression de la même manière que pour le premier déploiement.
Une fois la mise à jour terminée, vous pouvez rouvrir l'application Web. L'interface utilisateur de la conversation s'affiche avec la variable d'invite. Renseignez la valeur et saisissez du contenu non vide pour poursuivre la conversation.
Insérer du contenu multimodal
Vous pouvez insérer des entrées telles que des images, des vidéos, des fichiers audio et des documents dans l'interface utilisateur de conversation. Les entrées acceptées dépendent du modèle sélectionné pour la requête. Consultez la documentation sur la compatibilité multimodale pour chaque modèle.
Pour insérer un fichier, cliquez sur le bouton en forme de trombone dans le champ de saisie de la conversation.
Vous pourrez interagir avec le modèle à l'aide des entrées que vous fournissez.
Informations supplémentaires
Une fois que vous êtes familiarisé avec le processus de déploiement, vous pouvez envisager les actions suivantes.
Modifier le code source dans Cloud Run
Si vous souhaitez personnaliser l'application Web, vous pouvez modifier le code source dans Cloud Run. Ouvrez la page du code source Cloud Run à partir de la boîte de dialogue Gérer l'application Web en cliquant sur le bouton
Vous pouvez également accéder à la page de sécurité depuis l'application Web en cliquant sur le lien Éditeur de code source.
Sur la page du code source Cloud Run, cliquez sur Modifier la source pour passer en mode édition. Lorsque vous avez terminé, cliquez sur Enregistrer et redéployer.
Une fois le redéploiement terminé, vous devez ouvrir l'application depuis Vertex AI Studio. Vous pouvez accéder à la page Vertex AI Studio en cliquant sur le lien du badge Déployé depuis Vertex AI.
Accorder l'accès
Pour accorder aux utilisateurs ou aux groupes l'accès à l'application, procédez comme suit :
- Ouvrez la boîte de dialogue Gérer l'application Web.
- Cliquez sur l'icône en forme de crayon dans la colonne Contrôle d'accès. La page sur la sécurité de Cloud Run s'ouvre dans un nouvel onglet.
- Sur la page de sécurité Cloud Run, recherchez la case à cocher Identity-Aware Proxy (IAP). Assurez-vous qu'elle est cochée, puis cliquez sur Modifier la règle.
-
Une sous-tâche s'affiche pour vous permettre de modifier l'accès. Saisissez les adresses e-mail des utilisateurs ou des groupes dans le champ Principal.
Si vous êtes un utilisateur d'une organisation, vous ne pouvez ajouter que des utilisateurs de la même organisation.
- Laissez le champ des niveaux d'accès vide.
- Cliquez sur Enregistrer.
-
Une fois la sous-tâche fermée, cliquez à nouveau sur Enregistrer sur la page Cloud Run.
Désactiver l'accès public
Lorsque vous n'avez plus besoin que l'application Web soit accessible au public, vous pouvez la désactiver dans Cloud Run. Ouvrez la boîte de dialogue Gérer l'application Web, puis cliquez sur l'icône en forme de crayon
dans la colonne Contrôle des accès. La page sur la sécurité de Cloud Run s'ouvre dans un nouvel onglet.Vous pouvez également accéder à la page de sécurité depuis l'application Web en cliquant sur le lien Paramètres de sécurité.
Sur la page "Sécurité" du service Cloud Run correspondant à votre application Web, cochez la case Utiliser Cloud IAM pour authentifier les requêtes entrantes et sélectionnez Authentification requise. Cliquez sur Enregistrer.
Votre application Web ne sera alors plus accessible via l'URL. Si vous essayez d'y accéder, la page Erreur : Accès refusé s'affiche.
Réactiver l'accès public
Si vous souhaitez rétablir l'accès public, décochez la case Utiliser Cloud IAM pour authentifier les requêtes entrantes et enregistrez. Si vous choisissez l'option Autoriser les appels non authentifiés, elle ne fonctionnera pas si votre projet se trouve dans une organisation. Pour en savoir plus, consultez Authentification dans Cloud Run.
Configurer l'accès local pour le développement
Le contrôle des accès n'est pas encore disponible dans la version Preview publique. Par conséquent, une fois que vous avez désactivé l'accès public, la seule façon d'accéder à l'application Web est de configurer un proxy local. Pour ce faire, vous pouvez utiliser les commandes gcloud. Tout d'abord, ouvrez Cloud Shell en cliquant sur l'icône de terminal
en haut à droite de la console Google Cloud . Vous serez invité à autoriser Cloud Shell. Cliquez sur Autoriser pour continuer.
Une fois l'opération terminée, ouvrez la boîte de dialogue Gérer l'application Web et cliquez sur le bouton d'icône Plus
Une commande est ajoutée à votre Cloud Shell. Appuyez sur Entrée et attendez la fin de l'impression. Cliquez sur le lien dans la ligne commençant par Click on the
link to preview
. Vous pourrez consulter votre application. Ce lien ne fonctionne que lorsque la commande gcloud est en cours d'exécution.
Problèmes courants
Erreur d'authentification : aucune clé secrète
Si l'erreur suivante s'affiche, cela signifie qu'aucune clé secrète n'est ajoutée à l'URL. Suivez les instructions pour ouvrir l'application Web depuis Vertex AI Studio, ou copiez la clé secrète depuis la boîte de dialogue Gérer l'application et ajoutez-la à l'URL au format ?key=SECRET_KEY
.

Erreur d'authentification : clé secrète incorrecte
L'erreur suivante signifie que la clé ajoutée à l'URL n'est pas valide. La clé secrète est unique à chaque requête. Si vous disposez d'une clé secrète provenant d'une autre invite, elle ne fonctionnera pas. Suivez les instructions pour ouvrir correctement l'application Web.

400 Argument non valide : entrée vide
L'erreur suivante se produit lorsque vous avez des entrées dans la variable d'invite, mais que le chat est vide. Un message d'erreur 400 s'affiche alors. Pour résoudre ce problème, saisissez n'importe quel texte non vide, puis renvoyez le formulaire.

400 Argument non valide : le type MIME n'est pas accepté
Si vous choisissez un type de fichier non compatible avec le modèle, une erreur 400 s'affiche. C'est normal. Vous devrez utiliser d'autres types de fichiers compatibles avec le modèle. Consultez la documentation sur la compatibilité multimodale pour chaque modèle.

Étapes suivantes
Découvrez d'autres fonctionnalités de Vertex AI Studio dans la documentation ou le cours Introduction à Vertex AI Studio sur Google Cloud Skills Boost.
Consultez les tarifs de Cloud Run.
Consultez la section Authentification dans Cloud Run.