Démonstration : générer du contenu multimodal

Cette démonstration vous montre comment générer du contenu multimodal en transmettant une entrée multimodale, telle qu'un texte et une image, à un modèle Gemini à l'aide du SDK Vertex AI pour ABAP.

Avant de commencer

Avant d'exécuter cette démonstration, assurez-vous que vous ou vos administrateurs avez rempli les conditions préalables suivantes :

Générer du contenu multimodal

Pour générer du contenu multimodal, procédez comme suit :

  1. Dans l'interface utilisateur graphique de SAP, exécutez le code de transaction /GOOG/SDK_IMG.

    Vous pouvez également exécuter le code de transaction SPRO, puis cliquer sur SAP Reference IMG (IMG de référence SAP).

  2. Accédez à SDK ABAP pour Google Cloud > Démonstrations.

  3. Ouvrez SDK Vertex AI : démonstration : appeler des modèles Gemini textuels et multimodaux.

  4. Sélectionnez Générer du contenu multimodal.

  5. Dans le champ Clé client, saisissez la clé client pour l'authentification.

  6. Dans le champ Clé du modèle, saisissez la clé du modèle, qui est configurée dans les paramètres de génération du modèle.

  7. Indiquez les valeurs des champs suivants, le cas échéant :

    • Type MIME : spécifiez le type MIME standard IANA des données sources. La valeur par défaut est application/pdf.
    • URI GCS du fichier : pour ajouter une image ou un autre élément multimédia à votre requête, spécifiez l'URI du fichier stocké dans un bucket Cloud Storage.
    • Importer un contenu multimédia : pour ajouter une image ou un autre contenu multimédia à votre demande, importez le fichier depuis votre système local.

    Vous pouvez spécifier l'URI d'un fichier stocké dans un bucket Cloud Storage ou importer un fichier depuis votre système local.

  8. Dans le champ Saisir les instructions système, indiquez les instructions système.

  9. Dans le champ Saisir la requête, indiquez votre requête.

  10. Exécutez le programme. La zone Réponse du LLM affiche le contenu multimodal généré.