À propos des applications et des data stores

Cette page décrit les applications et data stores Vertex AI Search. Pour sur les data stores des agents Vertex AI, consultez Datastores pour les agents Vertex AI :

Avec Vertex AI Search, vous pouvez créer et l'associer à un data store. Un projet Google Cloud peut contenir plusieurs applications.

Relation entre les applications et les datastores

La relation entre les applications et les data stores dépend du type d'application :

  • Les applications de recherche génériques ont une relation de plusieurs à plusieurs avec les data stores. Quand ? si plusieurs data stores sont connectés à une seule application de recherche générique, appelée recherche combinée. Pour des informations sur les limitations de connecter une application de recherche à plusieurs applications ; data store, consultez À propos de la recherche combinée.

  • Une application de recommandations génériques est associée à son datastore de manière individuelle.

  • Une application multimédia entretient une relation de plusieurs à un avec son data store. Une application ne peut se connecter qu'à un seul data store, tandis qu'un data store donné peut être connecté à plusieurs applications. Par exemple, une application de recherche de contenus multimédias et une application de recommandations de contenus multimédias peuvent partager un data store.

  • Une application de recherche de services de santé a une relation de plusieurs à un avec son data store. Une application ne peuvent se connecter qu'à un seul data store, alors qu'un data store spécifique peut être connecté à plusieurs applications. Par exemple, une application destinée aux patients et une application destinée aux fournisseurs peuvent se connecter au même datastore.

    Pour une importation par lots des données de santé, les données sont importées dans un qui est intégré à une application. Pour l'importation de flux de données (preview) de données de santé, elles sont importées dans une entité, qui est un type de données qui se trouve dans un connecteur de données. Un connecteur de données est également un type de datastore situé dans une application.

Une fois qu'un entrepôt de données est connecté à une application, vous ne pouvez plus le dissocier.

Méthode de création d'une application et d'ingestion de données

La manière dont vous créez une application et ingérez des données dépend du type de données dont vous disposez:

  • Pour les données de site Web, vous utilisez la console Google Cloud, et non l'API, pour créer votre application et ingérer des données.

  • Pour les données structurées ou non structurées, vous pouvez utiliser la console Google Cloud ou l'API.

  • Pour les données de santé, vous pouvez utiliser la console Google Cloud ou l'API.

Documents

Chaque data store possède un ou plusieurs enregistrements de données, appelés documents. Quel présenté dans le document varie en fonction du type de données présentes dans le data store:

  • Site Web Un document est une page Web.

  • Données structurées : Un document est une ligne d'un tableau ou un fichier JSON qui suit un schéma particulier. Vous pouvez fournir ce schéma vous-même ou laisser Vertex AI Agent Builder le déduire des données ingérées.

  • Données structurées pour les médias : Un document est une ligne d'un tableau ou un fichier JSON qui suit un schéma spécifique aux contenus multimédias. Les documents sont des enregistrements concernant des contenus multimédias, tels que des vidéos, des articles d'actualité, des fichiers musicaux et des podcasts. Un document contient des informations qui décrit l'élément multimédia, au minimum: titre, URI de l'emplacement du contenu, les catégories, la durée et la date de disponibilité.

  • Données structurées pour les sources de données tierces (version Preview avec liste d'autorisation) Un document est une entité spécifique à la source de données tierce, comme un problème Jira ou un espace Confluence.

  • Données non structurées Un document est un fichier au format HTML, PDF avec texte intégré ou TXT. Les formats PPTX et DOCX sont disponibles en version preview.

  • Données FHIR de santé Un document est une ressource FHIR R4 compatible. Pour obtenir la liste des ressources FHIR R4 compatibles avec la recherche Vertex AI, consultez la documentation de référence sur le schéma de données FHIR R4 Healthcare.

Data stores et applications

Dans Vertex AI Agent Builder, il existe différents types de data stores. Un datastore ne peut contenir qu'un seul type de données.

Données de site Web

Un data store contenant des données de site Web utilise les données indexées à partir de sites Web publics. Vous pouvez fournir un ensemble de domaines et configurer une recherche ou des recommandations sur les données explorées à partir des domaines. Ces données incluent le texte, les images taguées avec des métadonnées et des données structurées.

Par exemple, vous pouvez indiquer des domaines tels que yourexamplewebsite.com/faq et yourexamplewebsite.com/events et activez la recherche ou les recommandations pour la période du contenu sur ces domaines.

Il existe deux types de magasins de données de site Web :

  • Recherche de base sur un site Web:

    • Fournit des fonctionnalités de recherche par rapport à l'index de recherche Google existant pour les sites Web inclus.
    • La validation du domaine n'est pas nécessaire.
  • Indexation avancée de site Web:

    • Il offre des fonctionnalités de recherche avancée par rapport à un index généré en fonction dans l'index de recherche Google pour les sites Web concernés. Les propriétaires de l'application Vertex AI Agent Builder peuvent ensuite étendre la couverture de l'index en une nouvelle exploration des sites Web chaque fois que cela est nécessaire, et de les maintenir à jour. Pour en savoir plus, consultez Actualiser les pages Web. Les fonctionnalités avancées de l'indexation avancée de site Web sont listées dans la section Indexation avancée de site Web.
    • Nécessite la validation du domaine. Pour en savoir plus, consultez Valider les domaines de site Web.
    • Permet d'ajouter des données structurées au schéma de data store. Un site Web contient des données non structurées, mais vous pouvez ajouter des données structurées dans le de balises meta, d'attributs PageMap et de données schema.org pages Web. Vous pouvez ensuite utiliser ces données structurées pour modifier le data store comme expliqué dans Utilisez des données structurées pour l'indexation avancée de site Web.

Étape suivante

Pour la recherche sur un site Web:

Pour obtenir des recommandations:

Données structurées

Un data store contenant des données structurées permet d'effectuer des recherches sémantiques ou des recommandations. plutôt que des données structurées. Vous pouvez importer des données depuis BigQuery Cloud Storage. Vous pouvez également importer manuellement des données JSON structurées via l'API.

Par exemple, vous pouvez activer la recherche ou les recommandations dans un catalogue de produits pour votre expérience du commerce électronique ou un annuaire de médecins pour la recherche de fournisseurs ou recommandations.

Vertex AI Agent Builder détecte automatiquement le schéma à partir des données que vous importez. Vous pouvez également fournir un schéma pour vos données. Fournir un schéma pour vos données améliore généralement la qualité des résultats.

Étape suivante

Pour une recherche générique:

Pour les recommandations génériques :

Données structurées pour les médias

Les applications multimédias ne peuvent être associées qu'à des data stores de contenus multimédias. Données multimédias sont des data stores structurés qui utilisent un schéma défini par Google ou le vôtre schéma personnalisé qui contient un ensemble spécifique de cinq champs liés aux contenus multimédias. Pour Pour en savoir plus sur le schéma, consultez À propos des documents multimédias et des données. magasins.

Par exemple, vous pouvez activer les recommandations en créant une recommandation de médias pour un catalogue de films ou un site d'actualités, afin que vos utilisateurs disposent et des suggestions personnalisées.

En plus des documents multimédias, les data stores multimédias contiennent également les informations sur les événements utilisateur qui permettent à Vertex AI Search de personnaliser les recommandations et de rechercher vos utilisateurs. Les événements utilisateur sont obligatoires pour les applications de recommandations de contenus multimédias et sont recommandés pour les applications de recherche de contenus multimédias. Pour en savoir plus sur les événements utilisateur, consultez Enregistrer des événements utilisateur en temps réel.

Étape suivante

Données structurées pour les data stores tiers

Les connecteurs de sources de données tierces suivants sont disponibles en version preview avec liste d'autorisation:

  • Confluence
  • Jira
  • Salesforce
  • SharePoint Online
  • Slack

Les données de ces tiers sont considérées comme des données structurées.

Lorsque vous configurez un nouveau connecteur, vous sélectionnez une fréquence de synchronisation. Toi et sélectionner les entités à synchroniser. Les entités varient en fonction de la source, telles que comme des problèmes pour Jira et du contenu et des espaces pour Confluence. Un data store unique est pour chaque entité. Les data stores d'entités sont regroupés par instance de connecteur.

Étape suivante

Pour le Réseau de Recherche:

Pour obtenir des recommandations:

Données non structurées

Un entrepôt de données non structurées permet d'effectuer des recherches sémantiques ou des recommandations sur des données telles que des documents et des images.

Les data stores non structurés acceptent les documents au format HTML, PDF avec texte intégré et TXT. Les formats PPTX et DOCX sont disponibles en version preview.

La recherche fournit des résultats sous la forme de 10 URL et de réponses résumées pour les requêtes en langage naturel. Les documents doivent être importés dans un bucket Cloud Storage bucket disposant des autorisations d'accès appropriées. Par exemple, une institution financière peut activer la recherche ou les recommandations sur son corpus privé de publications de recherche financière, ou une entreprise de biotechnologie peut activer la recherche ou les recommandations sur son dépôt privé de recherches médicales.

Étape suivante

Pour la recherche :

Pour les recommandations génériques :

Données FHIR Healthcare

Une application de recherche dans le secteur de la santé utilise des données FHIR R4 importées à partir d'un flux FHIR de l'API Cloud Healthcare Google Store. Pour obtenir la liste des ressources FHIR R4 compatibles avec la recherche Vertex AI, consultez la documentation de référence sur le schéma de données FHIR R4 pour le secteur de la santé. Un datastore FHIR R4 doit répondre à certaines exigences avant de pouvoir être utilisé comme source de données pour le datastore de recherche Vertex AI. Pour en savoir plus, découvrez comment préparer les données FHIR de santé à l'ingestion.

Étape suivante

À propos de la recherche combinée

Vous pouvez créer une application de recherche combinée, dans laquelle plusieurs data stores peuvent être associés à une seule application de recherche générique. Cette fonctionnalité vous permet d'utiliser une seule application pour effectuer des recherches dans plusieurs sources et types de données.

Pour créer une application de recherche combinée, sélectionnez plusieurs data stores lorsque vous créez une application de recherche générique. Si vous ne sélectionnez pas plusieurs data stores lors de la création, vous ne pourrez pas en ajouter plus tard.

Lorsque vous obtenez des résultats de recherche, vous pouvez effectuer une recherche dans tous les datastores ou filtrer les résultats d'un seul datastore.

Les limites suivantes s'appliquent :

  • Ajouter et supprimer des datastores:
    • Pour activer la recherche combinée pour une application, vous devez y associer au moins deux magasins de données lors de la création de l'application.
    • Vous pouvez ajouter ou supprimer des data stores d'une application de recherche combinée, mais l'application ne peut pas avoir moins de deux data stores associés à tout moment.
    • Si vous connectez un data store unique à une application de recherche lors de sa création, alors vous ne pouvez pas ajouter ou supprimer ce data store.
  • L'indexation avancée de site Web doit être activée pour les data stores de site Web afin qu'ils puissent être utilisés pour la recherche combinée. Pour en savoir plus, consultez la page Indexation avancée de sites Web.
  • Les entrepôts de données contenant des données non structurées importées à l'aide de BigQuery ne sont pas acceptés.
  • La recherche combinée autorise les champs suivants dans les requêtes de recherche :
    • query
    • pageSize
    • offset
    • dataStoreSpec
    • pageToken
    • filter
    • spellCorrectionSpec
    • session
    • contentSearchSpec :
      • summarySpec
      • extractiveContentSpec
      • searchResultMode
      • chunkSpec
  • En plus des champs listés précédemment, les champs suivants ne sont compatibles avec les applications de recherche combinée que lorsque les requêtes de recherche sont filtrées pour obtenir des résultats à partir d'un seul data store. Elles ne sont pas acceptées lorsque vous obtenez des résultats à partir de plusieurs datastores :
    • facetSpec
  • La recherche combinée autorise les champs suivants dans dataStoreSpec :
    • filter : si des filtres sont spécifiés pour SearchRequest et dataStoreSpec, les deux filtres sont appliqués aux résultats de recherche.
  • Les opérations CRUD (création, lecture, mise à jour et suppression) sur les configurations de diffusion sont prises en charge pour les applications combinées. Seuls les champs suivants peuvent être ajoutés ou mis à jour dans une configuration de diffusion :
    • name
    • displayName
    • solutionType
    • genericConfig :
      • contentSearchSpec :
        • summarySpec
        • extractiveContentSpec
        • searchResultMode
        • chunkSpec
    • boostControlIds
    • synonymsControlIds
    • onewaySynonymsControlIds
  • Les opérations CRUD sur les commandes suivantes sont acceptées pour les applications de recherche combinée :
    • boostAction
    • synonymACtion
  • Les applications de recherche combinée ne sont pas compatibles avec les fonctionnalités suivantes :
    • Filtrage, redirection, ignorer, remplacement et dissociation des commandes de diffusion
    • Extraits utilisant contentSearchSpec.snippetSpec dans les requêtes de recherche ou configurations de diffusion
    • Recherche avec questions complémentaires