Cette démonstration vous montre comment générer du contenu multimodal en transmettant une entrée multimodale, telle qu'un texte et une image, à un modèle Gemini à l'aide du SDK Vertex AI pour ABAP.
Avant de commencer
Avant d'exécuter cette démonstration, assurez-vous que vous ou vos administrateurs avez rempli les conditions préalables suivantes :
- Activer l'API Vertex AI dans votre projet Google Cloud.
- Configurer l'authentification pour accéder à l'API Vertex AI.
- Configurer les paramètres de génération de modèle.
Générer du contenu multimodal
Pour générer du contenu multimodal, procédez comme suit :
Dans l'interface utilisateur graphique de SAP, exécutez le code de transaction
/GOOG/SDK_IMG
.Vous pouvez également exécuter le code de transaction
SPRO
, puis cliquer sur SAP Reference IMG (IMG de référence SAP).Accédez à SDK ABAP pour Google Cloud > Démonstrations.
Ouvrez SDK Vertex AI : démonstration : appeler des modèles Gemini textuels et multimodaux.
Sélectionnez Générer du contenu multimodal.
Dans le champ Clé client, saisissez la clé client pour l'authentification.
Dans le champ Clé du modèle, saisissez la clé du modèle, qui est configurée dans les paramètres de génération du modèle.
Indiquez les valeurs des champs suivants, le cas échéant :
- Type MIME : spécifiez le type MIME standard IANA des données sources.
La valeur par défaut est
application/pdf
. - URI GCS du fichier : pour ajouter une image ou un autre élément multimédia à votre requête, spécifiez l'URI du fichier stocké dans un bucket Cloud Storage.
- Importer un contenu multimédia : pour ajouter une image ou un autre contenu multimédia à votre demande, importez le fichier depuis votre système local.
Vous pouvez spécifier l'URI d'un fichier stocké dans un bucket Cloud Storage ou importer un fichier depuis votre système local.
- Type MIME : spécifiez le type MIME standard IANA des données sources.
La valeur par défaut est
Dans le champ Saisir les instructions système, indiquez les instructions système.
Dans le champ Saisir la requête, indiquez votre requête.
Exécutez le programme. La zone Réponse du LLM affiche le contenu multimodal généré.