À propos des applications et des datastores

Cette page décrit les applications et les data stores Gemini Enterprise.

Avec Gemini Enterprise, vous créez une application et vous l'associez à un data store. Un même projet Google Cloud peut contenir plusieurs applications.

Termes clés :

  • Application : une application Gemini Enterprise fournit des résultats de recherche, des actions et des agents à vos utilisateurs finaux. Le terme application peut être utilisé de manière interchangeable avec le terme moteur dans le contexte des API.

  • Datastore : un data store est une entité qui contient les données ingérées à partir d'une source de données first party (comme Cloud Storage) ou d'applications tierces (comme Jira ou Salesforce). Les data stores contenant des données provenant d'applications tierces sont également appelés connecteurs de données.

Relation entre les applications et les datastores

Une application doit être connectée à un data store pour pouvoir utiliser ses données afin de fournir des résultats de recherche, des réponses ou des actions.

Les applications entretiennent une relation de type plusieurs à plusieurs avec les datastores. Lorsque plusieurs data stores sont associés à une même application, on parle de recherche combinée. Pour en savoir plus sur les limites associées à la connexion d'une application de recherche à plusieurs data store, consultez À propos de la recherche combinée.

Méthode de création d'applications et d'ingestion de données

La façon dont vous créez une application et ingérez des données dépend du type de données dont vous disposez :

  • Pour les données tierces, vous utilisez la console Google Cloud , et non l'API, pour créer votre application et ingérer des données.

  • Pour les autres données, vous pouvez utiliser la console Google Cloud ou l'API.

Documents

Chaque data store contient un ou plusieurs enregistrements de données, appelés documents. Ce qu'un document représente dépend du type de données du data store :

  • Données pour les sources de données tierces. Un document est une entité spécifique à la source de données tierces, comme un problème Jira ou un espace Confluence.

  • Données structurées Un document est une ligne de table ou un enregistrement JSON qui suit un schéma particulier. Vous pouvez fournir ce schéma vous-même ou laisser Gemini Enterprise le déduire depuis les données ingérées.

  • Données non structurées Un document correspond à un fichier au format HTML, PDF avec du texte intégré ou TXT. Les formats PPTX et DOCX sont disponibles en version Preview.

Datastores et applications

Dans Gemini Enterprise, il existe différents types de datastores. Un data store ne peut contenir qu'un seul type de données.

Données structurées pour les data stores tiers

Les connecteurs de sources de données tierces suivants sont disponibles en version Preview avec liste d'autorisation :

  • Confluence
  • Jira
  • Salesforce
  • SharePoint Online
  • Slack

Les données provenant de ces tiers sont considérées comme des données structurées.

Lorsque vous configurez un connecteur, vous sélectionnez une fréquence de synchronisation. Vous pouvez également sélectionner les entités à synchroniser. Les entités varient en fonction de la source, comme les problèmes pour Jira et le contenu et les espaces pour Confluence. Un data store unique est créé pour chaque entité. Les data stores d'entités sont regroupés par instance de connecteur.

Étapes suivantes

Données structurées

Un data store avec des données structurées permet la recherche sémantique ou les recommandations basées sur des données structurées. Vous pouvez importer des données depuis BigQuery ou Cloud Storage. Vous pouvez également importer manuellement des données JSON structurées via l'API.

Par exemple, vous pouvez activer la recherche ou les recommandations dans un catalogue de produits pour votre expérience d'e-commerce, ou dans un annuaire de médecins pour la recherche ou les recommandations de fournisseurs.

Gemini Enterprise détecte automatiquement le schéma à partir des données que vous importez. Vous pouvez également fournir un schéma pour vos données. Fournir un schéma pour vos données améliore généralement la qualité des résultats.

Étapes suivantes

Données non structurées

Un data store non structurées permet la recherche sémantique ou les recommandations basées sur des données telles que des documents et des images.

Les dépôts de données non structurées acceptent les documents aux formats HTML, PDF avec texte intégré et TXT. Les formats PPTX et DOCX sont disponibles en version Preview.

La recherche fournit des résultats sous la forme de 10 URL et de réponses résumées aux requêtes en langage naturel. Les documents doivent être importés dans un bucket Cloud Storage avec les autorisations d'accès appropriées. Par exemple, une institution financière peut activer la recherche ou les recommandations sur son corpus privé de publications de recherche financière, ou une entreprise de biotechnologie peut activer la recherche ou les recommandations sur son dépôt privé de recherches médicales.

Étapes suivantes

À propos de la recherche mixte

La recherche combinée permet d'associer plusieurs data stores à une même application. L'application peut ainsi effectuer des recherches dans plusieurs sources et types de données.

Pour créer une application de recherche combinée, sélectionnez plusieurs data stores lorsque vous créez une application. Si vous ne sélectionnez pas plusieurs data stores lors de la création, vous ne pourrez pas en ajouter d'autres par la suite.

Lorsque vous obtenez des résultats de recherche, vous pouvez effectuer une recherche dans tous les datastores ou filtrer les résultats d'un seul data store.

La recherche combinée présente les limites suivantes :

  • Ajouter et supprimer des data stores :
    • Pour activer la recherche combinée pour une application, vous devez y associer au moins deux data stores lors de la création de l'application.
    • Vous pouvez ajouter ou supprimer des data stores dans une application de recherche combinée, mais l'application doit toujours être associée à au moins deux data stores.
    • Si vous associez un seul data store à une application de recherche lors de la création de l'application, vous ne pourrez pas ajouter ni supprimer ce data store.
  • Les data stores contenant des données non structurées importées à l'aide de BigQuery ne sont pas acceptés.
  • La recherche combinée autorise les champs suivants dans les requêtes de recherche :
    • boostSpec
    • contentSearchSpec
    • dataStoreSpecs
    • facetSpecs
    • filter
    • languageCode
    • offset
    • oneBoxPageSize
    • orderBy
    • query
    • pageSize
    • pageToken
    • relevanceScoreSpec
    • relevanceThreshold
    • session
    • sessionSpec
    • spellCorrectionSpec
    • userInfo
    • userPseudoId
  • La recherche mixte autorise les champs suivants dans dataStoreSpecs :
    • dataStore
    • boostSpec : si des spécifications d'amplification sont spécifiées pour SearchRequest et dataStoreSpecs, les deux spécifications d'amplification sont appliquées aux résultats de recherche.
    • filter : si des filtres sont spécifiés pour SearchRequest et dataStoreSpecs, les deux filtres sont appliqués aux résultats de recherche.
  • Les opérations CRUD (création, lecture, mise à jour et suppression) sur les configurations de diffusion sont acceptées pour les applications combinées. Seuls les champs suivants peuvent être ajoutés ou mis à jour dans une configuration de diffusion :
    • boostControlIds
    • displayName
    • filterControlIds
    • genericConfig :
      • contentSearchSpec
    • name
    • solutionType
    • synonymsControlIds
  • Les opérations CRUD sur les contrôles suivants sont acceptées pour les applications de recherche mixte :
    • boostAction
    • synonymAction
    • filterAction
  • Le nombre de data stores par application de recherche est limité à 50.
  • Si un data store utilise une configuration CMEK, tous les autres magasins de données doivent également utiliser la même configuration CMEK.