L'anonimizzazione è il processo di rimozione delle informazioni identificative dai dati. L'API Cloud Healthcare rileva i dati sensibili nelle istanze DICOM e nelle risorse FHIR, ad esempio le informazioni sanitarie protette (PHI), e utilizza una trasformazione di anonimizzazione per mascherare, eliminare o oscurare in altro modo i dati. L'anonimizzazione ha più casi d'uso, tra cui:
- Quando si condividono informazioni sanitarie con parti non autorizzate
- Quando si creano set di dati da diverse fonti e li si analizzano
- Quando è necessario anonimizzare i dati per utilizzarli in modelli di machine learning
Panoramica dell'anonimizzazione
L'anonimizzazione funziona ai seguenti livelli:
- A livello del set di dati. L'anonimizzazione si verifica su tutti i dati negli archivi DICOM e FHIR nel set di dati. Se un set di dati contiene sia istanze DICOM sia risorse FHIR, puoi anonimizzare tutte le istanze e le risorse contemporaneamente.
Per anonimizzare i dati sensibili a livello di set di dati, chiama il metododatasets.deidentify
dell'API Cloud Healthcare. - A livello di negozio FHIR. L'anonimizzazione si verifica su tutti i dati in uno specifico archivio FHIR in un set di dati.
Per anonimizzare i dati sensibili a livello di archivio FHIR, chiama il metodofhirStores.deidentify
dell'API Cloud Healthcare. - A livello di negozio DICOM. L'anonimizzazione si verifica su tutti i dati in uno specifico archivio
DICOM in un set di dati.
Per anonimizzare i dati sensibili a livello di archivio DICOM, chiama il metododicomStores.deidentify
dell'API Cloud Healthcare.
L'anonimizzazione non influisce sul set di dati originale, sull'archivio FHIR, sull'archivio DICOM o sui dati originali. A seconda di come configuri l'anonimizzazione, l'operazione si comporta come segue:
- Se stai anonimizzando i dati a livello di set di dati, le copie anonimizzate dei dati originali vengono scritte in un nuovo set di dati chiamato set di dati di destinazione.
- Se stai anonimizzando i dati a livello di archivio DICOM o FHIR, le copie anonimizzate dei dati originali vengono scritte in un archivio DICOM o FHIR esistente in un set di dati esistente. L'archivio DICOM di output e l'archivio FHIR sono chiamati rispettivamente l'archivio DICOM di destinazione e l'archivio FHIR di destinazione.
Il set di dati di origine, l'archivio FHIR o l'archivio DICOM e il set di dati di destinazione, l'archivio FHIR o l'archivio DICOM devono trovarsi nella stessa località Google Cloud. L'anonimizzazione dei dati in più località Google Cloud non è supportata.
Località anonimizzata
Quando l'API Cloud Healthcare anonimizza i dati, questi potrebbero essere elaborati in una località diversa da quella in cui si trovano l'archivio FHIR o DICOM di origine e di destinazione. Al termine dell'anonimizzazione, i dati vengono archiviati nella stessa località Google Cloud dell'archivio FHIR di origine o dell'archivio DICOM.
Anonimizzazione dei dati nella console Google Cloud
Puoi anonimizzare i dati per un set di dati, un archivio FHIR o un archivio DICOM dall'interno della console Google Cloud. Per ulteriori informazioni, consulta Anonimizzazione dei dati nella console Google Cloud (DICOM) e Anonimizzazione dei dati nella console Google Cloud (FHIR).
Anonimizzazione DICOM
Un'istanza DICOM contiene un insieme di elementi di metadati chiave-valore (noti come tag) e una o più immagini. L'operazione deidentify
può rimuovere tag specifici
che contengono dati sensibili. nonché utilizzare la funzione automatica di riconoscimento ottico dei caratteri (OCR) per oscurare il testo integrato delle immagini contenute nelle istanze DICOM.
Per esempi su come anonimizzare i dati DICOM, consulta Anonimizzazione dei dati DICOM.
Anonimizzazione FHIR
Ogni risorsa FHIR è un oggetto di tipo JSON che contiene elementi chiave-valore.
Alcuni elementi sono standardizzati, mentre altri sono in testo libero. Puoi utilizzare l'operazione deidentify
per ottenere uno dei seguenti risultati:
Rimuovere valori specifici nella risorsa
Elaborare parti di testo arbitrarie modo da rimuovere solo le sezioni sensibili, lasciando il resto dei dati così come è
Per esempi su come anonimizzare i dati FHIR, consulta Anonimizzazione dei dati FHIR.