Per cercare dati clinici in Vertex AI Search, puoi seguire uno di questi workflow:
- Crea un datastore sanitario, importa i dati FHIR R4 nel datastore, connettilo a un'app di ricerca sanitaria ed esegui query sui dati clinici.
- Crea un'app di ricerca dei dati sanitari, crea un datastore sanitari e importa i dati FHIR R4 nelldatastore#39;archivio durante il processo di creazione dell'app ed esegui query sui dati clinici. Per saperne di più, vedi Creare un'app di ricerca per il settore sanitario.
Questa pagina descrive il primo metodo.
Informazioni sulla frequenza di importazione dei dati
Puoi importare i dati FHIR R4 in un datastore nei seguenti modi:
Importazione batch: un'importazione una tantum. I dati vengono importati in un datastore in batch. Per ulteriori importazioni incrementali, vedi Aggiornare i dati sanitari.
Importazione streaming: un'importazione di dati streaming quasi in tempo reale. Eventuali modifiche incrementali nell'archivio FHIR di origine vengono sincronizzate nel datastore Vertex AI Search. Lo streaming richiede un connettore dati, che è un tipo di datastore. Per creare un connettore dati, devi configurare una raccolta. Un connettore dati contiene un'entità, che è anche un'istanza di datastore.
Puoi anche mettere in pausa e riprendere lo streaming ed eseguire la sincronizzazione manuale ogni volta che è necessario. Per saperne di più, vedi Gestire un archivio di dati di ricerca sanitaria.
La velocità di streaming dei dati per un determinato progetto Google Cloud dipende dalle seguenti quote. Se superi la quota, potresti riscontrare ritardi nello streaming.
- Il numero di scritture in streaming FHIR o BigQuery in attesa al minuto. Per ulteriori informazioni, consulta Quote e limiti.
- Il numero di operazioni di lettura FHIR al minuto per regione. Per saperne di più, consulta Quote FHIR dell'API Cloud Healthcare.
Puoi selezionare la frequenza di importazione dei dati al momento della creazione del datastore e non puoi modificare questa configurazione in un secondo momento.
Prima di iniziare
Prima di creare il datastore sanitario e importare i dati, tieni presente quanto segue:
La relazione tra app e datastore per la ricerca dei dati sanitari. Per ulteriori informazioni, vedi Informazioni su app e datastore.
Vertex AI Search for healthcare fornisce servizi di ricerca solo nella multiregione Stati Uniti (
us
). Pertanto, l'app di ricerca per il settore sanitario e i datastore devono risiedere nella multiregioneus
.Se importi dati sanitari da un archivio FHIR dell'API Cloud Healthcare in un progetto Google Cloud a un datastore di Vertex AI Search in un progetto Google Cloud diverso e utilizzi Controlli di servizio VPC, i due progetti devono trovarsi nello stesso perimetro.
Crea un datastore e importa i dati
Puoi creare un datastore e importare i tuoi dati FHIR R4 nella consoleGoogle Cloud o utilizzando l'API con i seguenti approcci:
- Puoi creare un datastore statico con un'importazione batch una tantum. Per ulteriori informazioni, vedi Creare un datastore statico ed eseguire un'importazione batch una tantum.
- Puoi creare un datastore di streaming con le modifiche apportate al tuo archivio FHIR dell'API Cloud Healthcare trasmesse in streaming continuo al tuo datastore Vertex AI Search. Per saperne di più, vedi Creare un datastore di streaming e configurare un'importazione di streaming.
Crea un datastore statico ed esegui un'importazione batch una tantum
Questa sezione descrive come creare un datastore Vertex AI Search in cui puoi eseguire solo importazioni batch. Puoi importare i dati batch quando crei il datastore e eseguire importazioni batch incrementali ogni volta che è necessario.
Console
Nella Google Cloud console, vai alla pagina AI Applications.
Nel menu di navigazione, fai clic su Datastore.
Fai clic su add_box Crea datastore.
- Nel riquadro Seleziona un'origine dati, scegli API Healthcare (FHIR) come origine dati.
- Per importare i dati dal datastore FHIR, esegui una delle seguenti operazioni:
- Seleziona l'archivio FHIR dall'elenco degli archivi FHIR disponibili:
- Espandi il campo Datastore FHIR.
- In questo elenco, seleziona un set di dati che si trova in una posizione consentita e poi seleziona un archivio FHIR che utilizza la versione R4 di FHIR.
- Inserisci manualmente l'archivio FHIR:
- Espandi il campo Datastore FHIR.
- Fai clic su Inserisci manualmente l'archivio FHIR.
- Nella finestra di dialogo Nome archivio FHIR, inserisci il nome completo dell'archivio FHIR nel seguente formato:
project/PROJECT_ID/locations/LOCATION/datasets/DATASET_ID/fhirStores/FHIR_STORE_ID
- Fai clic su Salva.
- Seleziona l'archivio FHIR dall'elenco degli archivi FHIR disponibili:
- Nella sezione Sincronizzazione, seleziona una delle seguenti opzioni.
Questa selezione non può essere modificata dopo la creazione del datastore.
- Una tantum: per eseguire un'importazione batch di dati una tantum. Per ulteriori importazioni incrementali, vedi Aggiornare i dati sanitari.
- Streaming: per eseguire un'importazione di dati in streaming quasi in tempo reale. Per trasmettere dati in streaming, devi creare un connettore dati, che è un tipo di datastore. Per configurare un datastore di streaming utilizzando l'API REST, contatta il tuo Customer Engineer.
- Nella sezione Qual è lo schema per questi dati?, seleziona una di queste opzioni:
- Schema predefinito di Google: per conservare le configurazioni dello schema definito da Google, ad esempio
indicizzazione, possibilità di ricerca e recupero, per le risorse e gli elementi
FHIR supportati. Dopo aver selezionato questa opzione, non puoi
aggiornare lo schema dopo aver creato il datastore. Se vuoi poter modificare lo schema dopo la creazione del datastore, seleziona l'opzione Schema personalizzato.
- Fai clic su Continua.
- Nel campo Nome del tuo datastore, inserisci un nome per il datastore.
- Fai clic su Crea.
Il datastore che hai creato è elencato nella pagina Datastore.
- Schema personalizzato: per definire le tue configurazioni dello schema, ad esempio
indicizzazione, possibilità di ricerca e recupero, per le risorse e gli elementi
FHIR supportati. Per configurare uno schema configurabile, contatta il tuo Customer Engineer.
- Fai clic su Continua.
- Esamina lo schema, espandi ogni campo e modifica le impostazioni del campo.
- Fai clic su Aggiungi nuovi campi per aggiungere nuovi campi alle risorse FHIR supportate. Non puoi rimuovere i campi forniti nello schema definito da Google.
- Fai clic su Continua.
- Nel campo Nome del connettore dati, inserisci un nome per il connettore dati.
- Fai clic su Crea.
Il connettore dati che hai creato è elencato nella pagina Datastore. L'archivio FHIR di origine viene aggiunto come entità all'interno del connettore dati.
- Schema predefinito di Google: per conservare le configurazioni dello schema definito da Google, ad esempio
indicizzazione, possibilità di ricerca e recupero, per le risorse e gli elementi
FHIR supportati. Dopo aver selezionato questa opzione, non puoi
aggiornare lo schema dopo aver creato il datastore. Se vuoi poter modificare lo schema dopo la creazione del datastore, seleziona l'opzione Schema personalizzato.
- Fai clic su Continua.
REST
Crea un datastore.
curl -X POST\ -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json"\ -H "X-Goog-User-Project: PROJECT_ID" \ "https://us-discoveryengine.googleapis.com/v1/projects/PROJECT_ID/locations/us/collections/default_collection/dataStores?dataStoreId=DATA_STORE_ID" \ -d '{ "displayName": "DATA_STORE_DISPLAY_NAME", "industryVertical": "HEALTHCARE_FHIR", "solutionTypes": ["SOLUTION_TYPE_SEARCH"], "searchTier": "STANDARD", "searchAddOns": ["LLM"], "healthcareFhirConfig": { "enableConfigurableSchema": CONFIGURABLE_SCHEMA_TRUE|FALSE } }'
Sostituisci quanto segue:
PROJECT_ID
: l'ID del tuo Google Cloud progetto.DATA_STORE_ID
: l'ID del datastore Vertex AI Search che vuoi creare. Questo ID può contenere solo lettere minuscole, cifre, trattini bassi e trattini.DATA_STORE_DISPLAY_NAME
: il nome visualizzato del datastore Vertex AI Search che vuoi creare.CONFIGURABLE_SCHEMA_TRUE|FALSE
: un valore booleano che, se impostato sutrue
, consente di configurare lo schema del datastore utilizzando il metodoschema.update
.
Se l'archivio FHIR di origine e il datastore di ricerca Vertex AI di destinazione si trovano nello stesso progetto Google Cloud , chiama il seguente metodo per eseguire un'importazione batch una tantum. Se non fanno parte dello stesso progetto, vai al passaggio successivo.
curl -X POST \ -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json; charset=utf-8" \ -H "X-Goog-User-Project: PROJECT_ID" \ "https://us-discoveryengine.googleapis.com/v1/projects/PROJECT_ID/locations/us/dataStores/DATA_STORE_ID/branches/0/documents:import" \ -d '{ "reconciliation_mode": "FULL", "fhir_store_source": {"fhir_store": "projects/PROJECT_ID/locations/CLOUD_HEALTHCARE_DATASET_LOCATION/datasets/CLOUD_HEALTHCARE_DATASET_ID/fhirStores/FHIR_STORE_ID"} }'
Sostituisci quanto segue:
PROJECT_ID
: l'ID del tuo Google Cloud progetto.DATA_STORE_ID
: l'ID del datastore Vertex AI Search.CLOUD_HEALTHCARE_DATASET_ID
: l'ID del set di dati dell'API Cloud Healthcare che contiene l'archivio FHIR di origine.CLOUD_HEALTHCARE_DATASET_LOCATION
: la posizione del set di dati dell'API Cloud Healthcare che contiene l'archivio FHIR di origine.FHIR_STORE_ID
: l'ID dello store FHIR R4 dell'API Cloud Healthcare.
Se l'archivio FHIR di origine e il datastore di ricerca Vertex AI di destinazione si trovano in progetti diversi, chiama il seguente metodo per eseguire un'importazione batch una tantum. Google Cloud Se fanno parte dello stesso progetto, torna al passaggio precedente.
curl -X POST \ -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json; charset=utf-8" \ -H "X-Goog-User-Project: PROJECT_ID" \ "https://us-discoveryengine.googleapis.com/v1/projects/PROJECT_ID/locations/us/dataStores/DATA_STORE_ID/branches/0/documents:import" \ -d '{ "reconciliation_mode": "FULL", "fhir_store_source": {"fhir_store": "projects/SOURCE_PROJECT_ID/locations/CLOUD_HEALTHCARE_DATASET_LOCATION/datasets/CLOUD_HEALTHCARE_DATASET_ID/fhirStores/FHIR_STORE_ID"} }'
Sostituisci quanto segue:
PROJECT_ID
: l'ID del progetto Google Cloud che contiene il datastore Vertex AI Search.DATA_STORE_ID
: l'ID del datastore Vertex AI Search.SOURCE_PROJECT_ID
: l'ID del progetto Google Cloud che contiene il set di dati dell'API Cloud Healthcare e il datastore FHIR.CLOUD_HEALTHCARE_DATASET_ID
: l'ID del set di dati dell'API Cloud Healthcare che contiene l'archivio FHIR di origine.CLOUD_HEALTHCARE_DATASET_LOCATION
: la posizione del set di dati dell'API Cloud Healthcare che contiene l'archivio FHIR di origine.FHIR_STORE_ID
: l'ID dello store FHIR R4 dell'API Cloud Healthcare.
Python
Per saperne di più, consulta la documentazione di riferimento dell'API AI Applications per Python.
Per autenticarti in AI Applications, configura le Credenziali predefinite dell'applicazione. Per ulteriori informazioni, vedi Configura l'autenticazione per un ambiente di sviluppo locale.
Crea un datastore
Importa documenti
Passaggi successivi
- Verifica la creazione del datastore e l'importazione dei dati FHIR.
- Annullare un'importazione batch in corso.
- Aggiorna lo datastore store.
Crea un datastore di dati in streaming e configura un'importazione in streaming
Questa sezione descrive come creare un datastore di Vertex AI Search in streaming che trasmette continuamente le modifiche dal datastore FHIR dell'API Cloud Healthcare.
Console
Nella Google Cloud console, vai alla pagina AI Applications.
Nel menu di navigazione, fai clic su Datastore.
Fai clic su add_box Crea datastore.
- Nel riquadro Seleziona un'origine dati, scegli API Healthcare (FHIR) come origine dati.
- Per importare i dati dal datastore FHIR, esegui una delle seguenti operazioni:
- Seleziona l'archivio FHIR dall'elenco degli archivi FHIR disponibili:
- Espandi il campo Datastore FHIR.
- In questo elenco, seleziona un set di dati che si trova in una posizione consentita e poi seleziona un archivio FHIR che utilizza la versione R4 di FHIR.
- Inserisci manualmente l'archivio FHIR:
- Espandi il campo Datastore FHIR.
- Fai clic su Inserisci manualmente l'archivio FHIR.
- Nella finestra di dialogo Nome archivio FHIR, inserisci il nome completo dell'archivio FHIR nel seguente formato:
project/PROJECT_ID/locations/LOCATION/datasets/DATASET_ID/fhirStores/FHIR_STORE_ID
- Fai clic su Salva.
- Seleziona l'archivio FHIR dall'elenco degli archivi FHIR disponibili:
- Nella sezione Sincronizzazione, seleziona una delle seguenti opzioni.
Questa selezione non può essere modificata dopo la creazione del datastore.
- Una tantum: per eseguire un'importazione batch di dati una tantum. Per ulteriori importazioni incrementali, vedi Aggiornare i dati sanitari.
- Streaming: per eseguire un'importazione di dati in streaming quasi in tempo reale. Per trasmettere dati in streaming, devi creare un connettore dati, che è un tipo di datastore. Per configurare un datastore di streaming utilizzando l'API REST, contatta il tuo Customer Engineer.
- Nella sezione Qual è lo schema per questi dati?, seleziona una di queste opzioni:
- Schema predefinito di Google: per conservare le configurazioni dello schema definito da Google, ad esempio
indicizzazione, possibilità di ricerca e recupero, per le risorse e gli elementi
FHIR supportati. Dopo aver selezionato questa opzione, non puoi
aggiornare lo schema dopo aver creato il datastore. Se vuoi poter modificare lo schema dopo la creazione del datastore, seleziona l'opzione Schema personalizzato.
- Fai clic su Continua.
- Nel campo Nome del tuo datastore, inserisci un nome per il datastore.
- Fai clic su Crea.
Il datastore che hai creato è elencato nella pagina Datastore.
- Schema personalizzato: per definire le tue configurazioni dello schema, ad esempio
indicizzazione, possibilità di ricerca e recupero, per le risorse e gli elementi
FHIR supportati. Per configurare uno schema configurabile, contatta il tuo Customer Engineer.
- Fai clic su Continua.
- Esamina lo schema, espandi ogni campo e modifica le impostazioni del campo.
- Fai clic su Aggiungi nuovi campi per aggiungere nuovi campi alle risorse FHIR supportate. Non puoi rimuovere i campi forniti nello schema definito da Google.
- Fai clic su Continua.
- Nel campo Nome del connettore dati, inserisci un nome per il connettore dati.
- Fai clic su Crea.
Il connettore dati che hai creato è elencato nella pagina Datastore. L'archivio FHIR di origine viene aggiunto come entità all'interno del connettore dati.
- Schema predefinito di Google: per conservare le configurazioni dello schema definito da Google, ad esempio
indicizzazione, possibilità di ricerca e recupero, per le risorse e gli elementi
FHIR supportati. Dopo aver selezionato questa opzione, non puoi
aggiornare lo schema dopo aver creato il datastore. Se vuoi poter modificare lo schema dopo la creazione del datastore, seleziona l'opzione Schema personalizzato.
- Fai clic su Continua.
REST
Crea un connettore dati per configurare lo streaming.
curl -X POST \ -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json" \ -H "X-Goog-User-Project: PROJECT_ID" \ "https://us-discoveryengine.googleapis.com/v1alpha/projects/PROJECT_ID/locations/us:setUpDataConnector" \ -d ' { "collectionId": "COLLECTION_ID", "collectionDisplayName": "COLLECTION_NAME", "dataConnector": { "dataSource": "gcp_fhir", "params": { "instance_uri": "projects/SOURCE_PROJECT_ID/locations/CLOUD_HEALTHCARE_DATASET_LOCATION/datasets/CLOUD_HEALTHCARE_DATASET_ID" }, "entities": [ { "entityName": "FHIR_STORE_NAME" "healthcareFhirConfig": { "enableConfigurableSchema": CONFIGURABLE_SCHEMA_TRUE|FALSE, "enableStaticIndexingForBatchIngestion": STATIC_INDEXING_TRUE|FALSE } } ], "syncMode": "STREAMING" } }'
Sostituisci quanto segue:
PROJECT_ID
: l'ID del tuo Google Cloud progetto.COLLECTION_ID
: l'ID della raccolta a cui vuoi trasmettere in streaming i dati FHIR R4.COLLECTION_NAME
: il nome della raccolta a cui vuoi trasmettere in streaming i dati FHIR R4.SOURCE_PROJECT_ID
: l'ID del progetto Google Cloud che contiene il set di dati dell'API Cloud Healthcare e il datastore FHIR.CLOUD_HEALTHCARE_DATASET_ID
: l'ID del set di dati dell'API Cloud Healthcare che contiene l'archivio FHIR di origine.CLOUD_HEALTHCARE_DATASET_LOCATION
: la posizione del set di dati dell'API Cloud Healthcare che contiene l'archivio FHIR di origine.FHIR_STORE_ID
: l'ID dello store FHIR R4 dell'API Cloud Healthcare.CONFIGURABLE_SCHEMA_TRUE|FALSE
: un valore booleano che, se impostato sutrue
, consente di configurare lo schema del datastore utilizzando il metodoschema.update
.STATIC_INDEXING_TRUE|FALSE
: un valore booleano che, se impostato sutrue
, consente di importare dati storici con una quota di indicizzazione più elevata. Ciò è utile quando prevedi che la tua app di ricerca debba gestire un volume di dati maggiore. Tuttavia, l'indicizzazione dei singoli record richiede più tempo. Google consiglia vivamente di impostare questo campo sutrue
.
- Se la raccolta viene creata correttamente, viene aggiunto un connettore dati all'elenco dei datastore nella pagina Datastore della console Google Cloud .
- Il connettore dati creato contiene un'entità con lo stesso nome dell'archivio FHIR R4 da cui stai trasmettendo in streaming i dati.
Passaggi successivi
- Verifica la creazione del datastore e l'importazione dei dati FHIR.
- Aggiorna lo datastore store.
- Mettere in pausa o riprendere lo streaming.
Verifica la creazione del datastore e l'importazione dei dati FHIR
Questa attività mostra come verificare se un datastore è stato creato correttamente e se i dati FHIR sono stati importati correttamente nel datastore.
- Nella Google Cloud console: seleziona il datastore e verifica i relativi dettagli.
- Tramite l'API REST:
- Utilizza il metodo
dataStores.get
per ottenere i dettagli del datastore dei dati sanitari. - Utilizza il metodo
operations.get
per ottenere i dettagli dell'operazione di importazione.
- Utilizza il metodo
Per verificare la creazione del datastore e l'importazione dei dati, completa i seguenti passaggi.
Console
Nella Google Cloud console, vai alla pagina AI Applications.
Nel menu di navigazione, fai clic su Datastore.
La pagina Datastore mostra un elenco dei datastore nel tuo progetto Google Cloudcon i relativi dettagli.
Verifica che il datastore o il connettore dati che hai creato sia presente nell'elenco dei datastore. Nell'elenco dei datastore, un connettore di dati che trasmette dati in streaming contiene un datastore con lo stesso nome dell'archivio FHIR dell'API Cloud Healthcare.
Seleziona il datastore o il connettore dati e verifica i relativi dettagli.
- Per un datastore:
- La tabella riepilogativa elenca i seguenti dettagli:
- L'ID, il tipo e la regione del datastore.
- Il numero di documenti che indica il numero di risorse FHIR importate.
- Timestamp dell'ultima importazione del documento.
- (Facoltativo) Fai clic su Visualizza dettagli per visualizzare i dettagli dell'importazione del documento, ad esempio i dettagli relativi a un'importazione riuscita, parziale o non riuscita.
- La scheda Documenti elenca gli ID risorsa delle risorse FHIR importate e i relativi tipi di risorsa in una tabella paginata. Puoi filtrare questa tabella per verificare se una risorsa specifica è stata importata.
- La scheda Attività elenca i dettagli dell'importazione dei documenti, ad esempio i dettagli relativi a un'importazione riuscita, parziale o non riuscita.
- La tabella riepilogativa elenca i seguenti dettagli:
- Per un connettore dati:
- La tabella riepilogativa elenca i seguenti dettagli:
- L'ID, il tipo e la regione della raccolta.
- Il nome dell'app collegata.
- Lo stato del connettore, che può essere attivo o in pausa.
- La tabella Entità mostra l'entità all'interno del connettore dati.
Il nome dell'entità è il nome dell'archivio FHIR di origine. L'ID dell'entità è
l'ID del connettore dati a cui è aggiunto il nome dell'archivio FHIR di origine.
- Fai clic sul nome dell'entità per visualizzarne i dettagli. Poiché un'entità è un'istanza di datastore all'interno di un connettore dati, i dettagli dell'entità sono gli stessi di un datastore.
- La tabella riepilogativa elenca i seguenti dettagli:
- Per un datastore:
Nella scheda Schema, visualizza le proprietà delle risorse e degli elementi FHIR supportati. Fai clic su Modifica per configurare lo schema.
REST
Verifica la creazione del datastore.
curl -X GET -H "Authorization: Bearer $(gcloud auth print-access-token)" \ -H "Content-Type: application/json"\ -H "X-Goog-User-Project: PROJECT_ID" \ "https://us-discoveryengine.googleapis.com/v1/projects/PROJECT_ID/locations/us/collections/default_collection/dataStores/DATA_STORE_ID"
Sostituisci quanto segue:
PROJECT_ID
: l'ID del tuo Google Cloud progetto.DATA_STORE_ID
: l'ID del datastore Vertex AI Search.
Verifica se l'operazione di importazione dei dati FHIR è stata completata.
curl -X GET \ -H "Authorization: Bearer $(gcloud auth print-access-token)" \ "https://us-discoveryengine.googleapis.com/v1/projects/PROJECT_ID/locations/us/collections/default_collection/dataStores/DATA_STORE_ID/branches/0/operations/IMPORT_OPERATION_ID"
Sostituisci quanto segue:
PROJECT_ID
: l'ID del tuo Google Cloud progetto.DATA_STORE_ID
: l'ID del datastore Vertex AI Search.IMPORT_OPERATION_ID
: l'ID operazione dell'operazione a lunga esecuzione restituito quando chiami il metodoimport
Passaggi successivi
- Crea un'app di ricerca dei dati sanitari e collegala al tuo datastore.
- Cerca i dati sanitari nell'app di ricerca dei dati sanitari.
- Aggiorna dati sanitari.