Anonimizzazione dei dati

L'anonimizzazione è il processo di rimozione delle informazioni identificative dai dati. L'API Cloud Healthcare rileva i dati sensibili nelle istanze DICOM e nelle risorse FHIR, ad esempio le informazioni sanitarie protette (PHI), e utilizza una trasformazione di anonimizzazione per mascherare, eliminare o oscurare in altro modo i dati. L'anonimizzazione ha più casi d'uso, tra cui:

  • Quando si condividono informazioni sanitarie con parti non autorizzate
  • Quando si creano set di dati da diverse fonti e li si analizzano
  • Quando è necessario anonimizzare i dati per utilizzarli in modelli di machine learning

Panoramica dell'anonimizzazione

L'anonimizzazione funziona ai seguenti livelli:

  • A livello del set di dati. L'anonimizzazione si verifica su tutti i dati negli archivi DICOM e FHIR nel set di dati. Se un set di dati contiene sia istanze DICOM sia risorse FHIR, puoi anonimizzare tutte le istanze e le risorse contemporaneamente.

    Per anonimizzare i dati sensibili a livello di set di dati, chiama il metodo datasets.deidentify dell'API Cloud Healthcare.
  • A livello di negozio FHIR. L'anonimizzazione si verifica su tutti i dati in uno specifico archivio FHIR in un set di dati.

    Per anonimizzare i dati sensibili a livello di archivio FHIR, chiama il metodo fhirStores.deidentify dell'API Cloud Healthcare.
  • A livello di negozio DICOM. L'anonimizzazione si verifica su tutti i dati in uno specifico archivio DICOM in un set di dati.

    Per anonimizzare i dati sensibili a livello di archivio DICOM, chiama il metodo dicomStores.deidentify dell'API Cloud Healthcare.

L'anonimizzazione non influisce sul set di dati originale, sull'archivio FHIR, sull'archivio DICOM o sui dati originali. A seconda di come configuri l'anonimizzazione, l'operazione si comporta come segue:

  • Se stai anonimizzando i dati a livello di set di dati, le copie anonimizzate dei dati originali vengono scritte in un nuovo set di dati chiamato set di dati di destinazione.
  • Se stai anonimizzando i dati a livello di archivio DICOM o FHIR, le copie anonimizzate dei dati originali vengono scritte in un archivio DICOM o FHIR esistente in un set di dati esistente. L'archivio DICOM di output e l'archivio FHIR sono chiamati rispettivamente l'archivio DICOM di destinazione e l'archivio FHIR di destinazione.

Il set di dati di origine, l'archivio FHIR o l'archivio DICOM e il set di dati di destinazione, l'archivio FHIR o l'archivio DICOM devono trovarsi nella stessa località Google Cloud. L'anonimizzazione dei dati in più località Google Cloud non è supportata.

Località anonimizzata

Quando l'API Cloud Healthcare anonimizza i dati, questi potrebbero essere elaborati in una località diversa da quella in cui si trovano l'archivio FHIR o DICOM di origine e di destinazione. Al termine dell'anonimizzazione, i dati vengono archiviati nella stessa località Google Cloud dell'archivio FHIR di origine o dell'archivio DICOM.

Anonimizzazione dei dati nella console Google Cloud

Puoi anonimizzare i dati per un set di dati, un archivio FHIR o un archivio DICOM dall'interno della console Google Cloud. Per ulteriori informazioni, consulta Anonimizzazione dei dati nella console Google Cloud (DICOM) e Anonimizzazione dei dati nella console Google Cloud (FHIR).

Anonimizzazione DICOM

Un'istanza DICOM contiene un insieme di elementi di metadati chiave-valore (noti come tag) e una o più immagini. L'operazione deidentify può rimuovere tag specifici che contengono dati sensibili. nonché utilizzare la funzione automatica di riconoscimento ottico dei caratteri (OCR) per oscurare il testo integrato delle immagini contenute nelle istanze DICOM.

Per esempi su come anonimizzare i dati DICOM, consulta Anonimizzazione dei dati DICOM.

Anonimizzazione FHIR

Ogni risorsa FHIR è un oggetto di tipo JSON che contiene elementi chiave-valore. Alcuni elementi sono standardizzati, mentre altri sono in testo libero. Puoi utilizzare l'operazione deidentify per ottenere uno dei seguenti risultati:

  • Rimuovere valori specifici nella risorsa

  • Elaborare parti di testo arbitrarie modo da rimuovere solo le sezioni sensibili, lasciando il resto dei dati così come è

Per esempi su come anonimizzare i dati FHIR, consulta Anonimizzazione dei dati FHIR.