Pour rechercher des données cliniques dans Vertex AI Search, vous pouvez suivre l'un des workflows suivants :
- Créez un data store de santé, importez-y des données FHIR R4, connectez-le à une application de recherche pour le secteur de la santé et interrogez les données cliniques.
- Créez une application de recherche pour le secteur de la santé, créez un data store de santé et importez des données FHIR R4 dans le data store lors de la création de l'application, puis interrogez les données cliniques. Pour en savoir plus, consultez Créer une application de recherche dans le secteur de la santé.
Cette page décrit la première méthode.
À propos de la fréquence d'importation des données
Vous pouvez importer des données FHIR R4 dans un data store de plusieurs façons :
Importation par lot : importation ponctuelle. Les données sont importées dans un data store par lots. Pour les importations incrémentielles supplémentaires, consultez Actualiser les données de santé.
Importation en flux continu : importation de données en flux continu quasi en temps réel. Toutes les modifications incrémentielles apportées au magasin FHIR source sont synchronisées dans le data store Vertex AI Search. Le streaming nécessite un connecteur de données, qui est un type de data store. Pour créer un connecteur de données, vous devez configurer une collection. Un connecteur de données contient une entité, qui est également une instance de data store.
Vous pouvez également mettre en pause et reprendre le streaming, et effectuer une synchronisation manuelle si nécessaire. Pour en savoir plus, consultez Gérer un data store de recherche dans le secteur de la santé.
Le débit de streaming de données pour un projet Google Cloud donné dépend des quotas suivants. Si vous dépassez le quota, vous risquez de rencontrer des problèmes de latence lors de la diffusion en flux continu.
- Nombre d'écritures en flux continu FHIR ou BigQuery en attente par minute. Pour en savoir plus, consultez la page Quotas et limites.
- Nombre d'opérations de lecture FHIR par minute et par région. Pour en savoir plus, consultez Quotas FHIR de l'API Cloud Healthcare.
Vous pouvez sélectionner la fréquence d'importation des données au moment de la création du data store. Vous ne pourrez pas modifier cette configuration ultérieurement.
Avant de commencer
Avant de créer le data store de santé et d'y importer des données, comprenez les points suivants :
Relation entre les applications et les data stores pour la recherche de données de santé. Pour en savoir plus, consultez À propos des applications et des datastores.
Vertex AI Search pour le secteur de la santé ne fournit des services de recherche que dans la multirégion des États-Unis (
us
). Par conséquent, votre application de recherche et vos data stores pour le secteur de la santé doivent résider dans la multirégionus
.Si vous importez des données de santé à partir d'un magasin FHIR de l'API Cloud Healthcare dans un projet Google Cloud vers un data store Vertex AI Search dans un autre projet Google Cloud et que vous utilisez VPC Service Controls, les deux projets doivent se trouver dans le même périmètre.
Créer un data store et importer vos données
Vous pouvez créer un data store et importer vos données FHIR R4 dans laGoogle Cloud console ou à l'aide de l'API en procédant comme suit :
- Vous pouvez créer un data store statique avec une importation par lot ponctuelle. Pour en savoir plus, consultez Créer un data store statique et effectuer une importation groupée unique.
- Vous pouvez créer un data store de streaming avec les modifications apportées à votre store FHIR de l'API Cloud Healthcare, qui sont diffusées en continu vers votre data store Vertex AI Search. Pour en savoir plus, consultez Créer un data store de flux de données et configurer une importation de flux.
Créer un data store statique et effectuer une importation par lot ponctuelle
Cette section explique comment créer un data store Vertex AI Search dans lequel vous ne pouvez effectuer que des importations par lot. Vous pouvez importer des données par lot lorsque vous créez le data store pour la première fois et effectuer des importations par lot incrémentielles chaque fois que nécessaire.
Console
Dans la console Google Cloud , accédez à la page AI Applications.
Dans le menu de navigation, cliquez sur Data Stores (Magasins de données).
Cliquez sur add_box Créer un data store.
- Dans le volet Sélectionner une source de données, sélectionnez API Healthcare (FHIR) comme source de données.
- Pour importer des données depuis votre store FHIR, procédez de l'une des manières suivantes :
- Sélectionnez le magasin FHIR dans la liste des magasins FHIR disponibles :
- Développez le champ Magasin FHIR.
- Dans cette liste, sélectionnez un ensemble de données situé dans un emplacement autorisé, puis sélectionnez un magasin FHIR qui utilise la version R4 de FHIR.
- Saisissez manuellement le magasin FHIR :
- Développez le champ Magasin FHIR.
- Cliquez sur Saisir manuellement le magasin FHIR.
- Dans la boîte de dialogue Nom du magasin FHIR, saisissez le nom complet du magasin FHIR au format suivant :
project/PROJECT_ID/locations/LOCATION/datasets/DATASET_ID/fhirStores/FHIR_STORE_ID
- Cliquez sur Enregistrer.
- Sélectionnez le magasin FHIR dans la liste des magasins FHIR disponibles :
- Dans la section Synchronisation, sélectionnez l'une des options suivantes.
Une fois le data store créé, vous ne pourrez plus modifier cette sélection.
- Ponctuel : pour effectuer une importation groupée de données ponctuelle. Pour en savoir plus sur les importations incrémentielles, consultez Actualiser les données de santé.
- Streaming : pour importer des données de flux en quasi-temps réel. Pour diffuser des données, vous devez créer un connecteur de données, qui est un type de data store. Pour configurer un data store de streaming à l'aide de l'API REST, contactez votre ingénieur client.
- Dans la section Quel est le schéma pour ces données ?, sélectionnez l'une des options suivantes :
- Schéma prédéfini Google : pour conserver les configurations de schéma définies par Google, telles que l'indexabilité, la capacité de recherche et la capacité de récupération, pour les ressources et éléments FHIR compatibles. Une fois cette option sélectionnée, vous ne pourrez plus mettre à jour le schéma après avoir créé le data store. Si vous souhaitez pouvoir modifier le schéma après la création du data store, sélectionnez l'option Schéma personnalisé.
- Cliquez sur Continuer.
- Dans le champ Nom de votre data store, saisissez un nom pour votre data store.
- Cliquez sur Créer.
Le data store que vous avez créé est listé sur la page Datastores.
- Schéma personnalisé : pour définir vos propres configurations de schéma, telles que l'indexabilité, la capacité de recherche et la récupérabilité, pour les ressources et les éléments FHIR compatibles. Pour configurer un schéma configurable, contactez votre ingénieur client.
- Cliquez sur Continuer.
- Examinez le schéma, développez chaque champ et modifiez les paramètres des champs.
- Cliquez sur Ajouter des champs pour ajouter des champs aux ressources FHIR compatibles. Vous ne pouvez pas supprimer les champs fournis dans le schéma défini par Google.
- Cliquez sur Continuer.
- Dans le champ Nom de votre connecteur de données, saisissez le nom de votre connecteur de données.
- Cliquez sur Créer.
Le connecteur de données que vous avez créé est listé sur la page Datastores. Le magasin FHIR source est ajouté en tant qu'entité dans le connecteur de données.
- Schéma prédéfini Google : pour conserver les configurations de schéma définies par Google, telles que l'indexabilité, la capacité de recherche et la capacité de récupération, pour les ressources et éléments FHIR compatibles. Une fois cette option sélectionnée, vous ne pourrez plus mettre à jour le schéma après avoir créé le data store. Si vous souhaitez pouvoir modifier le schéma après la création du data store, sélectionnez l'option Schéma personnalisé.
- Cliquez sur Continuer.
REST
Créer un datastore
curl -X POST\ -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json"\ -H "X-Goog-User-Project: PROJECT_ID" \ "https://us-discoveryengine.googleapis.com/v1/projects/PROJECT_ID/locations/us/collections/default_collection/dataStores?dataStoreId=DATA_STORE_ID" \ -d '{ "displayName": "DATA_STORE_DISPLAY_NAME", "industryVertical": "HEALTHCARE_FHIR", "solutionTypes": ["SOLUTION_TYPE_SEARCH"], "searchTier": "STANDARD", "searchAddOns": ["LLM"], "healthcareFhirConfig": { "enableConfigurableSchema": CONFIGURABLE_SCHEMA_TRUE|FALSE } }'
Remplacez les éléments suivants :
PROJECT_ID
: ID de votre projet Google Cloud .DATA_STORE_ID
: ID du data store Vertex AI Search que vous souhaitez créer. Cet ID ne peut contenir que des lettres minuscules, des chiffres, des traits de soulignement et des traits d'union.DATA_STORE_DISPLAY_NAME
: nom à afficher du data store Vertex AI Search que vous souhaitez créer.CONFIGURABLE_SCHEMA_TRUE|FALSE
: un booléen qui, lorsqu'il est défini surtrue
, vous permet de configurer le schéma du data store à l'aide de la méthodeschema.update
.
Si le magasin FHIR source et le data store Vertex AI Search cible se trouvent dans le même projet Google Cloud , appelez la méthode suivante pour effectuer une importation par lot unique. S'ils ne se trouvent pas dans le même projet, passez à l'étape suivante.
curl -X POST \ -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json; charset=utf-8" \ -H "X-Goog-User-Project: PROJECT_ID" \ "https://us-discoveryengine.googleapis.com/v1/projects/PROJECT_ID/locations/us/dataStores/DATA_STORE_ID/branches/0/documents:import" \ -d '{ "reconciliation_mode": "FULL", "fhir_store_source": {"fhir_store": "projects/PROJECT_ID/locations/CLOUD_HEALTHCARE_DATASET_LOCATION/datasets/CLOUD_HEALTHCARE_DATASET_ID/fhirStores/FHIR_STORE_ID"} }'
Remplacez les éléments suivants :
PROJECT_ID
: ID de votre projet Google Cloud .DATA_STORE_ID
: ID du data store Vertex AI Search.CLOUD_HEALTHCARE_DATASET_ID
: ID de l'ensemble de données de l'API Cloud Healthcare contenant le magasin FHIR source.CLOUD_HEALTHCARE_DATASET_LOCATION
: emplacement de l'ensemble de données de l'API Cloud Healthcare contenant le magasin FHIR source.FHIR_STORE_ID
: ID du magasin FHIR R4 de l'API Cloud Healthcare.
Si le FHIR Store source et le data store Vertex AI Search cible se trouvent dans des projets Google Cloud différents, appelez la méthode suivante pour effectuer une importation par lot unique. S'ils se trouvent dans le même projet, revenez à l'étape précédente.
curl -X POST \ -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json; charset=utf-8" \ -H "X-Goog-User-Project: PROJECT_ID" \ "https://us-discoveryengine.googleapis.com/v1/projects/PROJECT_ID/locations/us/dataStores/DATA_STORE_ID/branches/0/documents:import" \ -d '{ "reconciliation_mode": "FULL", "fhir_store_source": {"fhir_store": "projects/SOURCE_PROJECT_ID/locations/CLOUD_HEALTHCARE_DATASET_LOCATION/datasets/CLOUD_HEALTHCARE_DATASET_ID/fhirStores/FHIR_STORE_ID"} }'
Remplacez les éléments suivants :
PROJECT_ID
: ID du projet Google Cloudcontenant le data store Vertex AI Search.DATA_STORE_ID
: ID du data store Vertex AI Search.SOURCE_PROJECT_ID
: ID du projet Google Cloudcontenant l'ensemble de données et le magasin FHIR de l'API Cloud Healthcare.CLOUD_HEALTHCARE_DATASET_ID
: ID de l'ensemble de données de l'API Cloud Healthcare contenant le magasin FHIR source.CLOUD_HEALTHCARE_DATASET_LOCATION
: emplacement de l'ensemble de données de l'API Cloud Healthcare contenant le magasin FHIR source.FHIR_STORE_ID
: ID du magasin FHIR R4 de l'API Cloud Healthcare.
Python
Pour en savoir plus, consultez la documentation de référence de l'API AI Applications Python.
Pour vous authentifier auprès des applications d'IA, configurez les Identifiants par défaut de l'application. Pour en savoir plus, consultez Configurer l'authentification pour un environnement de développement local.
Créer un datastore
Importer des documents
Étapes suivantes
- Vérifiez la création du data store et l'importation des données FHIR.
- Annuler une importation groupée en cours
- Mettez à jour le schéma de votre data store.
Créer un datastore de flux de données et configurer une importation de flux
Cette section explique comment créer un datastore Vertex AI Search en flux continu qui diffuse en continu les modifications apportées à votre magasin FHIR de l'API Cloud Healthcare.
Console
Dans la console Google Cloud , accédez à la page AI Applications.
Dans le menu de navigation, cliquez sur Data Stores (Magasins de données).
Cliquez sur add_box Créer un data store.
- Dans le volet Sélectionner une source de données, sélectionnez API Healthcare (FHIR) comme source de données.
- Pour importer des données depuis votre store FHIR, procédez de l'une des manières suivantes :
- Sélectionnez le magasin FHIR dans la liste des magasins FHIR disponibles :
- Développez le champ Magasin FHIR.
- Dans cette liste, sélectionnez un ensemble de données situé dans un emplacement autorisé, puis sélectionnez un magasin FHIR qui utilise la version R4 de FHIR.
- Saisissez manuellement le magasin FHIR :
- Développez le champ Magasin FHIR.
- Cliquez sur Saisir manuellement le magasin FHIR.
- Dans la boîte de dialogue Nom du magasin FHIR, saisissez le nom complet du magasin FHIR au format suivant :
project/PROJECT_ID/locations/LOCATION/datasets/DATASET_ID/fhirStores/FHIR_STORE_ID
- Cliquez sur Enregistrer.
- Sélectionnez le magasin FHIR dans la liste des magasins FHIR disponibles :
- Dans la section Synchronisation, sélectionnez l'une des options suivantes.
Une fois le data store créé, vous ne pourrez plus modifier cette sélection.
- Ponctuel : pour effectuer une importation groupée de données ponctuelle. Pour en savoir plus sur les importations incrémentielles, consultez Actualiser les données de santé.
- Streaming : pour importer des données de flux en quasi-temps réel. Pour diffuser des données, vous devez créer un connecteur de données, qui est un type de data store. Pour configurer un data store de streaming à l'aide de l'API REST, contactez votre ingénieur client.
- Dans la section Quel est le schéma pour ces données ?, sélectionnez l'une des options suivantes :
- Schéma prédéfini Google : pour conserver les configurations de schéma définies par Google, telles que l'indexabilité, la capacité de recherche et la capacité de récupération, pour les ressources et éléments FHIR compatibles. Une fois cette option sélectionnée, vous ne pourrez plus mettre à jour le schéma après avoir créé le data store. Si vous souhaitez pouvoir modifier le schéma après la création du data store, sélectionnez l'option Schéma personnalisé.
- Cliquez sur Continuer.
- Dans le champ Nom de votre data store, saisissez un nom pour votre data store.
- Cliquez sur Créer.
Le data store que vous avez créé est listé sur la page Datastores.
- Schéma personnalisé : pour définir vos propres configurations de schéma, telles que l'indexabilité, la capacité de recherche et la récupérabilité, pour les ressources et les éléments FHIR compatibles. Pour configurer un schéma configurable, contactez votre ingénieur client.
- Cliquez sur Continuer.
- Examinez le schéma, développez chaque champ et modifiez les paramètres des champs.
- Cliquez sur Ajouter des champs pour ajouter des champs aux ressources FHIR compatibles. Vous ne pouvez pas supprimer les champs fournis dans le schéma défini par Google.
- Cliquez sur Continuer.
- Dans le champ Nom de votre connecteur de données, saisissez le nom de votre connecteur de données.
- Cliquez sur Créer.
Le connecteur de données que vous avez créé est listé sur la page Datastores. Le magasin FHIR source est ajouté en tant qu'entité dans le connecteur de données.
- Schéma prédéfini Google : pour conserver les configurations de schéma définies par Google, telles que l'indexabilité, la capacité de recherche et la capacité de récupération, pour les ressources et éléments FHIR compatibles. Une fois cette option sélectionnée, vous ne pourrez plus mettre à jour le schéma après avoir créé le data store. Si vous souhaitez pouvoir modifier le schéma après la création du data store, sélectionnez l'option Schéma personnalisé.
- Cliquez sur Continuer.
REST
Créez un connecteur de données pour configurer le streaming.
curl -X POST \ -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -H "X-Goog-User-Project: PROJECT_ID" \ "https://us-discoveryengine.googleapis.com/v1alpha/projects/PROJECT_ID/locations/us:setUpDataConnector" \ -d ' { "collectionId": "COLLECTION_ID", "collectionDisplayName": "COLLECTION_NAME", "dataConnector": { "dataSource": "gcp_fhir", "params": { "instance_uri": "projects/SOURCE_PROJECT_ID/locations/CLOUD_HEALTHCARE_DATASET_LOCATION/datasets/CLOUD_HEALTHCARE_DATASET_ID" }, "entities": [ { "entityName": "FHIR_STORE_NAME" "healthcareFhirConfig": { "enableConfigurableSchema": CONFIGURABLE_SCHEMA_TRUE|FALSE, "enableStaticIndexingForBatchIngestion": STATIC_INDEXING_TRUE|FALSE } } ], "syncMode": "STREAMING" } }'
Remplacez les éléments suivants :
PROJECT_ID
: ID de votre projet Google Cloud .COLLECTION_ID
: ID de la collection vers laquelle vous souhaitez diffuser les données FHIR R4.COLLECTION_NAME
: nom de la collection vers laquelle vous souhaitez diffuser les données FHIR R4.SOURCE_PROJECT_ID
: ID du projet Google Cloudcontenant l'ensemble de données et le magasin FHIR de l'API Cloud Healthcare.CLOUD_HEALTHCARE_DATASET_ID
: ID de l'ensemble de données de l'API Cloud Healthcare contenant le magasin FHIR source.CLOUD_HEALTHCARE_DATASET_LOCATION
: emplacement de l'ensemble de données de l'API Cloud Healthcare contenant le magasin FHIR source.FHIR_STORE_ID
: ID du magasin FHIR R4 de l'API Cloud Healthcare.CONFIGURABLE_SCHEMA_TRUE|FALSE
: valeur booléenne. Lorsque la valeur est définie surtrue
, vous pouvez configurer le schéma du data store à l'aide de la méthodeschema.update
.STATIC_INDEXING_TRUE|FALSE
: valeur booléenne. Si elle est définie surtrue
, vous pouvez importer des données historiques avec un quota d'indexation plus élevé. Cela est utile lorsque vous vous attendez à ce que votre application de recherche rencontre un volume de données plus élevé. Cependant, l'indexation des enregistrements individuels prend plus de temps. Google vous recommande vivement de définir ce champ surtrue
.
- Si la collection est créée, un connecteur de données est ajouté à la liste des data stores sur la page Data stores de la console Google Cloud .
- Le connecteur de données créé contient une entité portant le même nom que le magasin FHIR R4 à partir duquel vous diffusez les données.
Étapes suivantes
- Vérifiez la création du data store et l'importation des données FHIR.
- Mettez à jour le schéma de votre data store.
- Mettre en pause ou reprendre le streaming
Vérifier la création du data store et l'importation des données FHIR
Cette tâche vous montre comment vérifier si un data store a été créé et si des données FHIR y ont été importées.
- Dans la console Google Cloud : sélectionnez le data store et vérifiez ses détails.
- Avec l'API REST :
- Utilisez la méthode
dataStores.get
pour obtenir les détails du data store de santé. - Utilisez la méthode
operations.get
pour obtenir les détails de l'opération d'importation.
- Utilisez la méthode
Pour vérifier la création du data store et l'importation des données, procédez comme suit.
Console
Dans la console Google Cloud , accédez à la page AI Applications.
Dans le menu de navigation, cliquez sur Data Stores (Magasins de données).
La page Datastores affiche la liste des datastores de votre projet Google Cloudavec leurs détails.
Vérifiez si le data store ou le connecteur de données que vous avez créé figure dans la liste des data stores. Dans la liste des datastores, un connecteur de données qui diffuse des données en continu contient un data store portant le même nom que le magasin FHIR de l'API Cloud Healthcare.
Sélectionnez le data store ou le connecteur de données, puis vérifiez ses détails.
- Pour un data store :
- Le tableau récapitulatif contient les informations suivantes :
- ID, type et région du data store.
- Nombre de documents indiquant le nombre de ressources FHIR importées.
- Code temporel de la dernière importation de document.
- Vous pouvez également cliquer sur Afficher les détails pour consulter les détails de l'importation de documents, comme les informations sur une importation réussie, partielle ou ayant échoué.
- L'onglet Documents liste les ID de ressources des ressources FHIR importées et leurs types de ressources dans un tableau paginé. Vous pouvez filtrer ce tableau pour vérifier si une ressource spécifique a été importée.
- L'onglet Activité liste les détails de l'importation de documents, comme les informations sur une importation réussie, partielle ou ayant échoué.
- Le tableau récapitulatif contient les informations suivantes :
- Pour un connecteur de données :
- Le tableau récapitulatif contient les informations suivantes :
- ID, type et région de la collection
- Nom de l'application associée.
- État du connecteur (actif ou en veille).
- Le tableau Entités affiche l'entité dans le connecteur de données.
Le nom de l'entité correspond au nom du magasin FHIR source. L'ID de l'entité correspond à l'ID du connecteur de données auquel est ajouté le nom du magasin FHIR source.
- Cliquez sur le nom de l'entité pour afficher ses détails. Étant donné qu'une entité est une instance de data store dans un connecteur de données, les détails de l'entité sont identiques à ceux d'un data store.
- Le tableau récapitulatif contient les informations suivantes :
- Pour un data store :
Dans l'onglet Schéma, affichez les propriétés des ressources et des éléments FHIR compatibles. Cliquez sur Modifier pour configurer le schéma.
REST
Vérifiez que le data store a été créé.
curl -X GET -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json"\ -H "X-Goog-User-Project: PROJECT_ID" \ "https://us-discoveryengine.googleapis.com/v1/projects/PROJECT_ID/locations/us/collections/default_collection/dataStores/DATA_STORE_ID"
Remplacez les éléments suivants :
PROJECT_ID
: ID de votre projet Google Cloud .DATA_STORE_ID
: ID du data store Vertex AI Search.
Vérifiez si l'opération d'importation de données FHIR est terminée.
curl -X GET \ -H "Authorization: Bearer $(gcloud auth print-access-token)" \ "https://us-discoveryengine.googleapis.com/v1/projects/PROJECT_ID/locations/us/collections/default_collection/dataStores/DATA_STORE_ID/branches/0/operations/IMPORT_OPERATION_ID"
Remplacez les éléments suivants :
PROJECT_ID
: ID de votre projet Google Cloud .DATA_STORE_ID
: ID du data store Vertex AI Search.IMPORT_OPERATION_ID
: ID de l'opération de longue durée renvoyé lorsque vous appelez la méthodeimport
Étapes suivantes
- Créez une application de recherche de données de santé et associez-y votre data store.
- Recherchez des données de santé dans votre application de recherche Healthcare.
- Actualiser les données de santé