Gemini Enterprise puede buscar datos de Google Drive mediante la federación de datos, que obtiene información directamente de la fuente de datos especificada. Como los datos no se copian en el índice de Vertex AI Search, no tienes que preocuparte por el almacenamiento de datos.
Antes de empezar
- Debes haber iniciado sesión en la consola Google Cloud con la misma cuenta que usas para la instancia de Google Drive a la que quieres conectarte. Gemini Enterprise usa tu ID de cliente de Google Workspace para conectarse a Google Drive.
- Para aplicar el control de acceso a las fuentes de datos y proteger los datos en Gemini Enterprise, asegúrate de haber configurado tu proveedor de identidades.
Verifica que se pueda acceder a todos los documentos. Para ello, colócalos en una unidad compartida que sea propiedad del dominio o asigna la propiedad a un usuario del dominio.
Habilita las funciones inteligentes de Google Workspace en otros productos de Google para conectar los datos de Google Drive con Gemini Enterprise. Para obtener más información, consulta el artículo Activar o desactivar las funciones inteligentes de Google Workspace.
Si utilizas controles de seguridad, ten en cuenta sus limitaciones en relación con los datos de Google Drive, tal como se indica en la siguiente tabla:
Control de seguridad Ten en cuenta lo siguiente Residencia de los datos (DRZ) Gemini Enterprise solo garantiza la residencia de los datos en Google Cloud. Para obtener información sobre la residencia de los datos y Google Drive, consulta la guía de cumplimiento y la documentación de Google Workspace. Por ejemplo, Elige la región en la que se almacenan los datos y Soberanía digital. Claves de encriptado gestionadas por el cliente (CMEK) Tus claves solo cifran datos dentro de Google Cloud. Los controles de Cloud Key Management Service no se aplican a los datos almacenados en Google Drive. Transparencia de acceso Los registros de Transparencia de acceso muestran las acciones que lleva a cabo el personal de Google en el Google Cloud proyecto. También tendrás que revisar los registros de Transparencia de acceso creados por Google Workspace. Para obtener más información, consulta Eventos de registro de Transparencia de acceso en la documentación de ayuda para administradores de Google Workspace.
Crear un almacén de datos de Google Drive
Consola
Para usar la consola y hacer que los datos de Google Drive se puedan buscar, sigue estos pasos:
En la Google Cloud consola, ve a la página Gemini Enterprise.
En el menú de navegación, haga clic en Almacenes de datos.
Haz clic en
Crear almacén de datos.Crea un almacén de datos. En la página Seleccionar una fuente de datos, selecciona Google Drive.
Especifica la fuente de la unidad de tu almacén de datos.
- Todo: para añadir toda tu unidad al almacén de datos.
- Unidades compartidas específicas: añade el ID de carpeta de la unidad compartida.
- Carpetas compartidas específicas: añade el ID de las carpetas compartidas.
Para encontrar el ID de la carpeta de la unidad compartida o el ID de una carpeta específica, ve a la unidad o a la carpeta y copia el ID de la URL. La URL sigue este formato:
https://drive.google.com/corp/drive/folders/ID
.Por ejemplo,
https://drive.google.com/corp/drive/folders/123456789012345678901
.Especifica la fuente de la unidad. Haz clic en Continuar.
Elige una región para tu almacén de datos.
Escribe el nombre del almacén de datos.
Opcional: Para evitar que los datos de este almacén de datos se usen para generar contenido con IA generativa cuando consultes datos con la aplicación, haz clic en Opciones de IA generativa y selecciona Excluir de las funciones de IA generativa.
Haz clic en Crear.
Mensajes de error
En la siguiente tabla se describen los mensajes de error que pueden aparecer al trabajar con esta fuente de datos de Google, así como los códigos de error de HTTP y los pasos sugeridos para solucionar los problemas.
Código de error | Mensaje de error | Descripción | Solución de problemas |
---|---|---|---|
403 (Permiso denegado) | No se puede buscar con credenciales de cuentas de servicio en almacenes de datos de Google Workspace. | El motor en el que se realiza la búsqueda tiene almacenes de datos de Google Workspace y las credenciales transferidas son de una cuenta de servicio. No se admite la búsqueda con credenciales de cuenta de servicio en almacenes de datos de Google Workspace. | Llamar a la búsqueda con las credenciales de usuario o eliminar los almacenes de datos de Google Workspace del motor. |
403 (Permiso denegado) | Las cuentas de consumidor no se admiten en los almacenes de datos de Google Workspace. | La búsqueda se llama con una credencial de cuenta de consumidor (@gmail.com), que no se admite en los almacenes de datos de Google Workspace. | Elimina los almacenes de datos de Google Workspace del buscador o usa una cuenta de Google gestionada. |
403 (Permiso denegado) | El ID de cliente no coincide con el de Datastore | La búsqueda solo está permitida para los usuarios que pertenecen a la misma organización que los almacenes de datos de Google Workspace. | Quita los almacenes de datos de Google Workspace del motor o ponte en contacto con el equipo de Asistencia si el usuario y los almacenes de datos de Google Workspace deben estar en organizaciones diferentes. |
400 (Invalid Argument) | El motor no puede contener almacenes de datos predeterminados y compartidos de Google Drive. | No puedes conectar a la misma aplicación un almacén de datos que tenga todas tus unidades (opción predeterminada) y otro que tenga unidades compartidas específicas. | Para conectar una nueva fuente de datos de Google Drive a tu aplicación, primero desvincula el almacén de datos que no necesites y, después, añade el nuevo almacén de datos que quieras usar. |
Solución de problemas
Si tu búsqueda no devuelve el archivo que buscas, puede deberse a estas limitaciones del índice de búsqueda:
Solo se puede extraer 1 MB de texto y datos de formato de tu archivo para que se pueda buscar en él.
En la mayoría de los tipos de archivo, el tamaño no puede superar los 10 MB. Se aplican las siguientes excepciones:
- Los archivos XLSX (.xlsx) no pueden superar los 20 MB.
- Los archivos PDF (.pdf) no pueden superar los 30 MB.
- Los archivos de texto (.txt) no pueden superar los 100 MB.
El reconocimiento óptico de caracteres en archivos PDF está limitado a 80 páginas. No se indexará ningún PDF que tenga más de 50 MB o 80 páginas, y no se podrán buscar las palabras clave que superen el límite de indexación de 1 MB.
Pasos siguientes
Para adjuntar tu almacén de datos a una aplicación, crea una aplicación y selecciona tu almacén de datos siguiendo los pasos que se indican en Crear una aplicación.
Para ver una vista previa de cómo se muestran los resultados de búsqueda después de configurar tu aplicación y tu almacén de datos, consulta Vista previa de los resultados de búsqueda.