Utiliser Imagen avec Visual Captioning et Visual Question Answering (VQA) de de Vertex AI pour obtenir des informations sur les images (console)
Découvrez comment utiliser Imagen sur les fonctionnalités Visual Captioning et Visual Question Answering (VQA) de Vertex AI pour obtenir des informations textuelles sur une image. Ce guide de démarrage rapide vous explique comment utiliser les sous-titres visuels et VQA dans la console Google Cloud.
Avant de commencer
- Connectez-vous à votre compte Google Cloud. Si vous débutez sur Google Cloud, créez un compte pour évaluer les performances de nos produits en conditions réelles. Les nouveaux clients bénéficient également de 300 $ de crédits gratuits pour exécuter, tester et déployer des charges de travail.
-
Dans Google Cloud Console, sur la page de sélection du projet, sélectionnez ou créez un projet Google Cloud.
-
Vérifiez que la facturation est activée pour votre projet Google Cloud.
-
Activez l'API Vertex AI
-
Dans Google Cloud Console, sur la page de sélection du projet, sélectionnez ou créez un projet Google Cloud.
-
Vérifiez que la facturation est activée pour votre projet Google Cloud.
-
Activez l'API Vertex AI
Obtenir l'exemple d'image
Une fois que vous avez configuré votre environnement, vous pouvez obtenir un exemple d'image et utiliser les sous-titres visuels et les systèmes de questions-réponses visuels pour obtenir des informations sur l'image.
Pour obtenir l'exemple d'image, téléchargez l'image directement à partir de Cloud Storage ou utilisez la commande suivante pour l'enregistrer dans le répertoire actuel :
curl -O https://storage.googleapis.com/cloud-samples-data/generative-ai/image/vcap-vqa-quickstart_fish.jpg
Générer des descriptions d'images grâce à Visual Captioning
Une fois que vous avez obtenu l'exemple d'image, vous pouvez envoyer la requête de sous-titrage visuel pour obtenir une description textuelle de l'image.
Console
Dans la console Google Cloud, ouvrez l'onglet Vertex AI Studio > Vision du tableau de bord Vertex AI.
Dans le menu inférieur, cliquez sur
Légende.Cliquez sur Importer une image et sélectionnez l'image locale à sous-titrer.
Dans le panneau Parameters (Paramètres), définissez les éléments suivants :
- Nombre de sous-titres : sélectionnez
2
. - Langue : si ce n'est pas déjà fait, sélectionnez
English (en)
.
- Nombre de sous-titres : sélectionnez
Cliquez sur
Générer des sous-titres.
Générer des réponses aux questions avec VQA
Enfin, vous pouvez utiliser la même image pour poser une question à propos de l'image et obtenir une réponse à l'aide de la fonctionnalité VQA.
Console
Dans la console Google Cloud, ouvrez l'onglet Vertex AI Studio > Vision du tableau de bord Vertex AI.
Dans le menu inférieur, cliquez sur
Questions/Réponses visuelles.Cliquez sur Importer une image, puis sélectionnez l'image locale.
Dans le panneau Paramètres, sélectionnez deux comme Nombre de réponses.
Dans le champ d'invite (Poser une question ici), saisissez le texte suivant :
What color is the left fish?
Cliquez sur
Generate (Générer).
Félicitations ! Vous venez d'utiliser les fonctionnalités Visual Captioning et VQA d'Imagen pour obtenir des informations sur une image.
Effectuer un nettoyage
Pour éviter que les ressources utilisées sur cette page soient facturées sur votre compte Google Cloud, procédez comme suit :
Supprimer le projet
- Dans la console Google Cloud, accédez à la page Gérer les ressources.
- Dans la liste des projets, sélectionnez le projet que vous souhaitez supprimer, puis cliquez sur Supprimer.
- Dans la boîte de dialogue, saisissez l'ID du projet, puis cliquez sur Arrêter pour supprimer le projet.
Étapes suivantes
- Consultez les consignes d'utilisation d'Imagen sur Vertex AI.
- Découvrez les modèles pré-entraînés dans le jardin de modèles.
- Découvrez les bonnes pratiques d'IA responsable et les filtres de sécurité de Vertex AI.