En esta demostración, se muestra cómo generar incorporaciones multimodales pasando una entrada multimodal, como texto y una imagen, a un modelo de incorporación con el SDK de Vertex AI para ABAP.
Antes de comenzar
Antes de ejecutar esta demostración, asegúrate de que tú o tus administradores hayan completado los siguientes requisitos previos:
- Habilitaste la API de Vertex AI en tu proyecto de Google Cloud.
- Configura la autenticación para acceder a la API de Vertex AI.
- Configuraste los parámetros de generación del modelo. Para generar embeddings, solo se requieren los siguientes parámetros:
Client Key
,Model Key
,Model ID
,Google Cloud Region Location
yPublisher
.
Genera incorporaciones multimodales
Para generar incorporaciones multimodales, sigue estos pasos:
En la GUI de SAP, ejecuta el código de transacción
/GOOG/SDK_IMG
.Como alternativa, ejecuta el código de transacción
SPRO
y, luego, haz clic en IMG de referencia de SAP.Go to SDK de ABAP para Google Cloud > Demostraciones.
Abre la demostración: Invoca modelos de incorporación multimodal.
Selecciona Generar incorporaciones multimodales.
En el campo Clave de cliente, ingresa la clave de cliente para la autenticación.
En el campo Clave de modelo, ingresa la clave de modelo, que se configura en los parámetros de generación del modelo.
En el campo Dimensiones, ingresa la cantidad de dimensiones para las incorporaciones de salida, como
1408
. Para las incorporaciones multimodales, las dimensiones disponibles son128
,256
,512
y1408
.Especifica valores para los siguientes campos según corresponda:
- URI de GCS de la imagen: Para agregar una imagen a tu solicitud, especifica el URI de la imagen almacenada en un bucket de Cloud Storage.
- Subir imagen: Para agregar una imagen a tu solicitud, súbela desde tu sistema local.
- URI de GCS del video: Para agregar un video a tu solicitud, especifica el URI del video almacenado en un bucket de Cloud Storage.
Puedes especificar el URI de un archivo de Cloud Storage o subir un archivo desde tu sistema local.
En el campo Ingresar texto, proporciona el texto de entrada.
Ejecuta el programa. El área Respuesta del LLM muestra las incorporaciones generadas.