En esta página, se describen las apps y los almacenes de datos de Gemini Enterprise.
Con Gemini Enterprise, creas una app y la conectas a un almacén de datos. Un proyecto Google Cloud determinado puede contener varias apps.
Términos clave:
App: Una app de Gemini Enterprise proporciona resultados de la búsqueda, acciones y agentes a tus usuarios finales. El término app se puede usar indistintamente con el término motor en el contexto de las APIs.
Almacén de datos: Un almacén de datos es una entidad que contiene los datos transferidos desde una fuente de datos de origen, como Cloud Storage, o aplicaciones de terceros, como Jira o Salesforce. Los almacenes de datos que contienen datos de aplicaciones de terceros también se denominan conectores de datos.
Relación entre las apps y los almacenes de datos
Una app debe estar conectada a un almacén de datos para usar sus datos y mostrar resultados de la búsqueda, respuestas o acciones.
Las apps tienen una relación de varios a varios con los almacenes de datos. Cuando varios almacenes de datos están conectados a una sola app, se denomina búsqueda combinada. Para obtener información sobre las limitaciones de conectar una app de búsqueda a más de un almacén de datos, consulta Acerca de la búsqueda combinada.
Método de creación de la app y transferencia de datos
La forma en que creas una app y transfieres datos depende del tipo de datos que tengas:
En el caso de los datos de terceros, debes usar la consola de Google Cloud , no la API, para crear tu app y transferir datos.
Para otros datos, puedes usar la consola de Google Cloud o la API.
Documentos
Cada almacén de datos tiene uno o más registros de datos, llamados documentos. Lo que un documento representa varía según el tipo de datos en el almacén de datos:
Datos para fuentes de datos de terceros Un documento es una entidad específica de la fuente de datos de terceros, como una incidencia de Jira o un espacio de Confluence.
Datos estructurados Un documento es una fila en una tabla o un registro JSON que sigue un esquema en particular. Puedes proporcionar este esquema tú mismo o dejar que Gemini Enterprise lo derive de los datos transferidos.
Datos no estructurados Un documento es un archivo en formato HTML, PDF con texto incorporado o TXT. Los formatos PPTX y DOCX están disponibles en versión preliminar.
Almacenes de datos y apps
En Gemini Enterprise, existen varios tipos de almacenes de datos. Un almacén de datos solo puede contener un tipo de datos.
Datos estructurados para almacenes de datos de terceros
Los siguientes conectores de fuentes de datos de terceros están disponibles en la versión preliminar con lista de entidades permitidas:
- Confluence
- Jira
- Salesforce
- Sharepoint en línea
- Slack
Los datos de estos terceros se consideran datos estructurados.
Cuando configuras un conector nuevo, seleccionas una frecuencia de sincronización. También puedes seleccionar las entidades que deseas sincronizar. Las entidades varían según la fuente, como los problemas de Jira y el contenido y los espacios de Confluence. Se crea un almacén de datos único para cada entidad. Los almacenes de datos de entidades se agrupan por instancia de conector.
¿Qué sigue?
Datos estructurados
Un almacén de datos con datos estructurados permite la búsqueda semántica o las recomendaciones sobre datos estructurados. Puedes importar datos desde BigQuery o Cloud Storage. También puedes subir datos JSON estructurados de forma manual a través de la API.
Por ejemplo, puedes habilitar la búsqueda o las recomendaciones sobre un catálogo de productos para tu experiencia de comercio electrónico, o bien sobre un directorio de médicos para la búsqueda o las recomendaciones de proveedores.
Gemini Enterprise detecta automáticamente el esquema de los datos que importas. De manera opcional, puedes proporcionar un esquema para tus datos. Proporcionar un esquema para tus datos suele mejorar la calidad de los resultados.
¿Qué sigue?
- Prepara datos estructurados para la transferencia.
- Crea un almacén de datos de búsqueda con uno de estos métodos:
- Crea una app.
Datos no estructurados
Un almacén de datos no estructurados permite la búsqueda semántica o las recomendaciones sobre datos como documentos e imágenes.
Los almacenes de datos no estructurados admiten documentos en formato HTML, PDF con texto incorporado y TXT. Los formatos PPTX y DOCX están disponibles en versión preliminar.
La Búsqueda proporciona resultados en forma de 10 URLs y respuestas resumidas para las consultas en lenguaje natural. Los documentos se deben subir a un bucket de Cloud Storage con los permisos de acceso adecuados. Por ejemplo, una institución financiera puede habilitar la búsqueda o las recomendaciones en su corpus privado de publicaciones de investigación financiera, o una empresa de biotecnología puede habilitar la búsqueda o las recomendaciones en su repositorio privado de investigación médica.
¿Qué sigue?
- Prepara datos no estructurados para la transferencia.
- Crea un almacén de datos de búsqueda con uno de estos métodos:
- Crea un almacén de datos de origen para tus datos no estructurados.
- Crea una app.
Acerca de la búsqueda combinada
Con la búsqueda combinada, se pueden conectar varios almacenes de datos a una sola app, lo que permite que la app busque en varias fuentes y tipos de datos.
Para crear una app de búsqueda combinada, selecciona varios almacenes de datos cuando crees una app nueva. Si no seleccionas varios almacenes de datos durante la creación, no podrás agregar almacenes de datos adicionales más adelante.
Cuando obtienes resultados de la búsqueda, puedes buscar en todos los almacenes de datos o filtrar los resultados de un solo almacén de datos.
La Búsqueda combinada tiene las siguientes limitaciones:
- Cómo agregar y quitar almacenes de datos:
- Para activar la búsqueda combinada en una app, debes conectar al menos dos almacenes de datos a ella durante la creación de la app.
- Puedes agregar o quitar almacenes de datos de una app de búsqueda combinada, pero la app no puede tener menos de dos almacenes de datos conectados en ningún momento.
- Si conectas un solo almacén de datos a una app de búsqueda durante la creación de la app, no podrás agregar ni quitar ese almacén de datos.
- No se admiten los almacenes de datos que contienen datos no estructurados importados con BigQuery.
- La búsqueda combinada permite los siguientes campos en las solicitudes de búsqueda:
boostSpec
contentSearchSpec
dataStoreSpecs
facetSpecs
filter
languageCode
offset
oneBoxPageSize
orderBy
query
pageSize
pageToken
relevanceScoreSpec
relevanceThreshold
session
sessionSpec
spellCorrectionSpec
userInfo
userPseudoId
- La búsqueda combinada permite los siguientes campos en
dataStoreSpecs
:dataStore
boostSpec
: Si se especifican especificaciones de refuerzo paraSearchRequest
ydataStoreSpecs
, ambas se aplican a los resultados de la búsqueda.filter
: Si se especifican filtros paraSearchRequest
ydataStoreSpecs
, ambos se aplican a los resultados de la búsqueda.
- Las operaciones de creación, lectura, actualización y eliminación (CRUD) en las configuraciones de entrega son compatibles con las apps combinadas. Solo se pueden agregar o actualizar los siguientes campos en una configuración de publicación:
boostControlIds
displayName
filterControlIds
genericConfig
:contentSearchSpec
name
solutionType
synonymsControlIds
- Se admiten operaciones CRUD en los siguientes controles para las apps de búsqueda combinada:
boostAction
synonymAction
filterAction
- Hay un límite de 50 almacenes de datos por app de búsqueda.
- Si un almacén de datos usa una configuración de CMEK, todos los demás almacenes de datos también deben usar la misma configuración de CMEK.