Cette page a été traduite par l'API Cloud Translation.

Créer un data store de recherche dans le secteur de la santé

Attention :

Restrictions pour le secteur de la santé : en tant que client, vous vous engagez à ne pas utiliser les Services d'IA générative à des fins cliniques (pour plus de clarté, la recherche non clinique, la planification ou les autres tâches administratives ne font pas l'objet de restrictions), en remplacement d'un avis médical professionnel, ou de quelque manière que ce soit qui fait l'objet d'une supervision par une autorité de réglementation applicable, ou qui nécessite une autorisation ou une approbation de sa part, et à ne pas autoriser les Utilisateurs finaux à le faire. Pour en savoir plus, consultez la page Conditions spécifiques du service.
Pour plus de clarté, en ce qui concerne l'utilisation de Vertex AI Search pour récupérer et résumer des informations médicales existantes, la restriction d'utilisation à des fins cliniques signifie la restriction d'utilisation à des fins de diagnostic ou de traitement direct sans examen par un professionnel agréé conformément aux lois et réglementations applicables.
Le résultat généré n'est pas toujours totalement fiable. En raison de la nature des LLM et de l'IA générative, les résultats peuvent contenir des informations incorrectes ou biaisées (par exemple, stéréotypes ou autres contenus nuisibles) et doivent être examinés. L'ensemble des résumés ou des réponses doivent être considérés comme des brouillons et non comme définitifs.
Ce produit n'est pas destiné à fournir des informations sur la prévention, le diagnostic ou le traitement de maladies. Le produit n'est pas destiné à répondre aux questions concernant les recommandations de diagnostic ou de traitement. L'utilisation prévue de ce produit est de récupérer et de résumer les informations médicales existantes fournies par les utilisateurs.
En raison de la quantité limitée de données de test, il est possible que ce produit ne s'applique pas aux groupes d'âge de 0 à 18 ans et de 85 ans et plus. Par conséquent, lorsqu'ils examinent les résultats générés, les clients doivent tenir compte de la représentativité des sous-populations dans leurs données sources.

Pour rechercher des données cliniques dans Vertex AI Search, vous pouvez suivre l'un des workflows suivants :

Créez un data store de santé, importez-y des données FHIR R4, connectez-le à une application de recherche pour le secteur de la santé et interrogez les données cliniques.
Créez une application de recherche pour le secteur de la santé, créez un data store de santé et importez des données FHIR R4 dans le data store lors de la création de l'application, puis interrogez les données cliniques. Pour en savoir plus, consultez Créer une application de recherche dans le secteur de la santé.

Cette page décrit la première méthode.

À propos de la fréquence d'importation des données

Vous pouvez importer des données FHIR R4 dans un data store de plusieurs façons :

Importation par lot : importation ponctuelle. Les données sont importées dans un data store par lots. Pour les importations incrémentielles supplémentaires, consultez Actualiser les données de santé.
Importation en flux continu : importation de données en flux continu quasi en temps réel. Toutes les modifications incrémentielles apportées au magasin FHIR source sont synchronisées dans le data store Vertex AI Search. Le streaming nécessite un connecteur de données, qui est un type de data store. Pour créer un connecteur de données, vous devez configurer une collection. Un connecteur de données contient une entité, qui est également une instance de data store.

Vous pouvez également mettre en pause et reprendre le streaming, et effectuer une synchronisation manuelle si nécessaire. Pour en savoir plus, consultez Gérer un data store de recherche dans le secteur de la santé.

Le débit de streaming de données pour un projet Google Cloud donné dépend des quotas suivants. Si vous dépassez le quota, vous risquez de rencontrer des problèmes de latence lors de la diffusion en flux continu.
- Nombre d'écritures en flux continu FHIR ou BigQuery en attente par minute. Pour en savoir plus, consultez la page Quotas et limites.
- Nombre d'opérations de lecture FHIR par minute et par région. Pour en savoir plus, consultez Quotas FHIR de l'API Cloud Healthcare.

Vous pouvez sélectionner la fréquence d'importation des données au moment de la création du data store. Vous ne pourrez pas modifier cette configuration ultérieurement.

Avant de commencer

Avant de créer le data store de santé et d'y importer des données, comprenez les points suivants :

Relation entre les applications et les data stores pour la recherche de données de santé. Pour en savoir plus, consultez À propos des applications et des datastores.
La préparation de vos données FHIR pour l'ingestion.
Vertex AI Search pour le secteur de la santé ne fournit des services de recherche que dans la multirégion des États-Unis (us). Par conséquent, votre application de recherche et vos data stores pour le secteur de la santé doivent résider dans la multirégion us.
Si vous importez des données de santé à partir d'un magasin FHIR de l'API Cloud Healthcare dans un projet Google Cloud vers un data store Vertex AI Search dans un autre projet Google Cloud et que vous utilisez VPC Service Controls, les deux projets doivent se trouver dans le même périmètre.

Créer un data store et importer vos données

Vous pouvez créer un data store et importer vos données FHIR R4 dans laGoogle Cloud console ou à l'aide de l'API en procédant comme suit :

Vous pouvez créer un data store statique avec une importation par lot ponctuelle. Pour en savoir plus, consultez Créer un data store statique et effectuer une importation groupée unique.
Vous pouvez créer un data store de streaming avec les modifications apportées à votre store FHIR de l'API Cloud Healthcare, qui sont diffusées en continu vers votre data store Vertex AI Search. Pour en savoir plus, consultez Créer un data store de flux de données et configurer une importation de flux.

Autorisations requises pour cette tâche

Attribuez les rôles IAM (Identity and Access Management) suivants au compte de service service-PROJECT_NUMBER@gcp-sa-discoveryengine.iam.gserviceaccount.com dans le projet contenant le data store Applications d'IA :

Objectif	Rôles
Pour effectuer une importation groupée ponctuelle de données FHIR à partir de magasins FHIR dans l'API Cloud Healthcare.	Utilisateur de job BigQuery (`roles/bigquery.jobUser`) Éditeur de données BigQuery (`roles/bigquery.dataEditor`) Administrateur de magasins FHIR Healthcare (`roles/healthcare.fhirStoreAdmin`)
Pour effectuer une importation en flux continu de données FHIR à partir de magasins FHIR dans l'API Cloud Healthcare dans le même projet Google Cloud .	Utilisateur de job BigQuery (`roles/bigquery.jobUser`) Éditeur de données BigQuery (`roles/bigquery.dataEditor`) Administrateur de magasins FHIR Healthcare (`roles/healthcare.fhirStoreAdmin`) Lecteur de ressources FHIR Healthcare (`roles/healthcare.fhirResourceReader`)
Pour effectuer une importation en flux continu de données FHIR à partir de magasins FHIR dans l'API Cloud Healthcare dans un autre projet Google Cloud .	Utilisateur de job BigQuery (`roles/bigquery.jobUser`) Éditeur de données BigQuery (`roles/bigquery.dataEditor`) Administrateur de magasins FHIR Healthcare (`roles/healthcare.fhirStoreAdmin`) Lecteur de ressources FHIR Healthcare (`roles/healthcare.fhirResourceReader`)
Importer des données FHIR qui font référence à des fichiers dans Cloud Storage Elles sont accordées par défaut si les fichiers référencés se trouvent dans le même projet Google Cloud que l'application AI Applications.	Administrateur des objets de l'espace de stockage (`roles/storage.objectAdmin`)
Pour personnaliser le schéma lors de la création d'un data store afin de configurer l'indexabilité, la capacité de recherche et la récupérabilité des ressources et des éléments FHIR.	Administrateur des objets de l'espace de stockage (`roles/storage.objectAdmin`)

Attribuez les rôles Identity and Access Management suivants au compte de service service-PROJECT_NUMBER@gcp-sa-discoveryengine.iam.gserviceaccount.com dans le projet contenant le data store FHIR R4 de l'API Cloud Healthcare :

Objectif	Rôles
Pour effectuer une importation en flux continu de données FHIR à partir de magasins FHIR dans l'API Cloud Healthcare dans un autre projet Google Cloud .	Administrateur de magasins FHIR Healthcare (`roles/healthcare.fhirStoreAdmin`) Lecteur de ressources FHIR Healthcare (`roles/healthcare.fhirResourceReader`)

Attribuez les rôles Identity and Access Management suivants au compte de service service-SOURCE_PROJECT_NUMBER@gcp-sa-healthcare.iam.gserviceaccount.com dans le projet contenant le data store FHIR R4 de l'API Cloud Healthcare :

Objectif	Rôles
Pour effectuer une importation en flux continu de données FHIR à partir de magasins FHIR dans l'API Cloud Healthcare dans le même projet Google Cloud .	Utilisateur de job BigQuery (`roles/bigquery.jobUser`) Éditeur de données BigQuery (`roles/bigquery.dataEditor`)
Pour personnaliser le schéma lors de la création d'un data store afin de configurer l'indexabilité, la capacité de recherche et la récupérabilité des ressources et des éléments FHIR.	Administrateur des objets de l'espace de stockage (`roles/storage.objectAdmin`)

Créer un data store statique et effectuer une importation par lot ponctuelle

Cette section explique comment créer un data store Vertex AI Search dans lequel vous ne pouvez effectuer que des importations par lot. Vous pouvez importer des données par lot lorsque vous créez le data store pour la première fois et effectuer des importations par lot incrémentielles chaque fois que nécessaire.

Console

Dans la console Google Cloud , accédez à la page AI Applications.

AI Applications
Dans le menu de navigation, cliquez sur Data Stores (Magasins de données).
Cliquez sur Créer un data store.
Dans le volet Sélectionner une source de données, sélectionnez API Healthcare (FHIR) comme source de données.
Pour importer des données depuis votre store FHIR, procédez de l'une des manières suivantes :
- Sélectionnez le magasin FHIR dans la liste des magasins FHIR disponibles :
  1. Développez le champ Magasin FHIR.
  2. Dans cette liste, sélectionnez un ensemble de données situé dans un emplacement autorisé, puis sélectionnez un magasin FHIR qui utilise la version R4 de FHIR.
- Saisissez manuellement le magasin FHIR :
  1. Développez le champ Magasin FHIR.
  2. Cliquez sur Saisir manuellement le magasin FHIR.
  3. Dans la boîte de dialogue Nom du magasin FHIR, saisissez le nom complet du magasin FHIR au format suivant :
    project/PROJECT_ID/locations/LOCATION/datasets/DATASET_ID/fhirStores/FHIR_STORE_ID
  4. Cliquez sur Enregistrer.
Dans la section Synchronisation, sélectionnez l'une des options suivantes. Une fois le data store créé, vous ne pourrez plus modifier cette sélection.
- Ponctuel : pour effectuer une importation groupée de données ponctuelle. Pour en savoir plus sur les importations incrémentielles, consultez Actualiser les données de santé.
- Streaming : pour importer des données de flux en quasi-temps réel. Pour diffuser des données, vous devez créer un connecteur de données, qui est un type de data store. Pour configurer un data store de streaming à l'aide de l'API REST, contactez votre ingénieur client.
Dans la section Quel est le schéma pour ces données ?, sélectionnez l'une des options suivantes :
- Schéma prédéfini Google : pour conserver les configurations de schéma définies par Google, telles que l'indexabilité, la capacité de recherche et la capacité de récupération, pour les ressources et éléments FHIR compatibles. Une fois cette option sélectionnée, vous ne pourrez plus mettre à jour le schéma après avoir créé le data store. Si vous souhaitez pouvoir modifier le schéma après la création du data store, sélectionnez l'option Schéma personnalisé.
  1. Cliquez sur Continuer.
  2. Dans le champ Nom de votre data store, saisissez un nom pour votre data store.
  3. Cliquez sur Créer.
- Schéma personnalisé : pour définir vos propres configurations de schéma, telles que l'indexabilité, la capacité de recherche et la récupérabilité, pour les ressources et les éléments FHIR compatibles. Pour configurer un schéma configurable, contactez votre ingénieur client.
  1. Cliquez sur Continuer.
  2. Examinez le schéma, développez chaque champ et modifiez les paramètres des champs.
  3. Cliquez sur Ajouter des champs pour ajouter des champs aux ressources FHIR compatibles. Vous ne pouvez pas supprimer les champs fournis dans le schéma défini par Google.
  4. Cliquez sur Continuer.
  5. Dans le champ Nom de votre connecteur de données, saisissez le nom de votre connecteur de données.
  6. Cliquez sur Créer.
Cliquez sur Continuer.

REST

Créer un datastore
```
curl -X POST\
 -H "Authorization: Bearer $(gcloud auth print-access-token)" \
 -H "Content-Type: application/json"\
 -H "X-Goog-User-Project: PROJECT_ID" \
"https://us-discoveryengine.googleapis.com/v1/projects/PROJECT_ID/locations/us/collections/default_collection/dataStores?dataStoreId=DATA_STORE_ID" \
 -d '{
    "displayName": "DATA_STORE_DISPLAY_NAME",
    "industryVertical": "HEALTHCARE_FHIR",
    "solutionTypes": ["SOLUTION_TYPE_SEARCH"],
    "searchTier": "STANDARD",
    "searchAddOns": ["LLM"],
    "healthcareFhirConfig":
      {
        "enableConfigurableSchema": CONFIGURABLE_SCHEMA_TRUE|FALSE
      }
}'
```
Remplacez les éléments suivants :
- PROJECT_ID : ID de votre projet Google Cloud .
- DATA_STORE_ID : ID du data store Vertex AI Search que vous souhaitez créer. Cet ID ne peut contenir que des lettres minuscules, des chiffres, des traits de soulignement et des traits d'union.
- DATA_STORE_DISPLAY_NAME : nom à afficher du data store Vertex AI Search que vous souhaitez créer.
- CONFIGURABLE_SCHEMA_TRUE|FALSE : un booléen qui, lorsqu'il est défini sur true, vous permet de configurer le schéma du data store à l'aide de la méthode schema.update.
Réponse

Vous devriez recevoir une réponse JSON semblable à la suivante. Si la valeur de la clé done est true, cela indique que l'opération de création du data store a été effectuée. Sinon, l'opération de création du data store a échoué.
```
{
  "name": "OPERATION_ID",
  "done": true
}
```
Si le magasin FHIR source et le data store Vertex AI Search cible se trouvent dans le même projet Google Cloud , appelez la méthode suivante pour effectuer une importation par lot unique. S'ils ne se trouvent pas dans le même projet, passez à l'étape suivante.
```
curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-H "X-Goog-User-Project: PROJECT_ID" \
"https://us-discoveryengine.googleapis.com/v1/projects/PROJECT_ID/locations/us/dataStores/DATA_STORE_ID/branches/0/documents:import" \
-d '{
   "reconciliation_mode": "FULL",
   "fhir_store_source": {"fhir_store": "projects/PROJECT_ID/locations/CLOUD_HEALTHCARE_DATASET_LOCATION/datasets/CLOUD_HEALTHCARE_DATASET_ID/fhirStores/FHIR_STORE_ID"}
}'
```
Remplacez les éléments suivants :
- PROJECT_ID : ID de votre projet Google Cloud .
- DATA_STORE_ID : ID du data store Vertex AI Search.
- CLOUD_HEALTHCARE_DATASET_ID : ID de l'ensemble de données de l'API Cloud Healthcare contenant le magasin FHIR source.
- CLOUD_HEALTHCARE_DATASET_LOCATION : emplacement de l'ensemble de données de l'API Cloud Healthcare contenant le magasin FHIR source.
- FHIR_STORE_ID : ID du magasin FHIR R4 de l'API Cloud Healthcare.
Réponse

Vous devriez recevoir une réponse JSON semblable à la suivante. La réponse contient un identifiant pour une opération de longue durée. Les opérations de longue durée sont renvoyées lorsque les appels de méthode peuvent prendre un temps considérable. Notez la valeur de IMPORT_OPERATION_ID. Vous avez besoin de cette valeur pour vérifier l'état de l'importation ou annuler une importation par lot en cours.
```
  {
    "name": "projects/PROJECT_ID/locations/us/collections/default_collection/dataStores/DATA_STORE_ID/branches/0/operations/IMPORT_OPERATION_ID",
    "metadata": {
      "@type": "type.googleapis.com/google.cloud.discoveryengine.v1.ImportDocumentsMetadata"
    }
  }
```
Si le FHIR Store source et le data store Vertex AI Search cible se trouvent dans des projets Google Cloud différents, appelez la méthode suivante pour effectuer une importation par lot unique. S'ils se trouvent dans le même projet, revenez à l'étape précédente.
```
curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-H "X-Goog-User-Project: PROJECT_ID" \
"https://us-discoveryengine.googleapis.com/v1/projects/PROJECT_ID/locations/us/dataStores/DATA_STORE_ID/branches/0/documents:import" \
-d '{
   "reconciliation_mode": "FULL",
   "fhir_store_source": {"fhir_store": "projects/SOURCE_PROJECT_ID/locations/CLOUD_HEALTHCARE_DATASET_LOCATION/datasets/CLOUD_HEALTHCARE_DATASET_ID/fhirStores/FHIR_STORE_ID"}
}'
```
Remplacez les éléments suivants :
- PROJECT_ID : ID du projet Google Cloudcontenant le data store Vertex AI Search.
- DATA_STORE_ID : ID du data store Vertex AI Search.
- SOURCE_PROJECT_ID : ID du projet Google Cloudcontenant l'ensemble de données et le magasin FHIR de l'API Cloud Healthcare.
- CLOUD_HEALTHCARE_DATASET_ID : ID de l'ensemble de données de l'API Cloud Healthcare contenant le magasin FHIR source.
- CLOUD_HEALTHCARE_DATASET_LOCATION : emplacement de l'ensemble de données de l'API Cloud Healthcare contenant le magasin FHIR source.
- FHIR_STORE_ID : ID du magasin FHIR R4 de l'API Cloud Healthcare.
Réponse

Vous devriez recevoir une réponse JSON semblable à la suivante. La réponse contient un identifiant pour une opération de longue durée. Les opérations de longue durée sont renvoyées lorsque les appels de méthode peuvent prendre un temps considérable. Notez la valeur de IMPORT_OPERATION_ID. Vous aurez besoin de cette valeur pour vérifier l'état de l'importation.
```
{
  "name": "projects/PROJECT_ID/locations/us/collections/default_collection/dataStores/DATA_STORE_ID/branches/0/operations/IMPORT_OPERATION_ID",
  "metadata": {
    "@type": "type.googleapis.com/google.cloud.discoveryengine.v1.ImportDocumentsMetadata"
  }
}
```

Python

Pour en savoir plus, consultez la documentation de référence de l'API AI Applications Python.

Pour vous authentifier auprès des applications d'IA, configurez les Identifiants par défaut de l'application. Pour en savoir plus, consultez Configurer l'authentification pour un environnement de développement local.