Questa pagina è stata tradotta dall'API Cloud Translation.

Anonimizzazione dei dati

L'anonimizzazione è il processo di rimozione delle informazioni identificative dai dati. L'API Cloud Healthcare rileva i dati sensibili nelle istanze DICOM e nelle risorse FHIR, ad esempio le informazioni sanitarie protette (PHI), quindi utilizza una trasformazione di anonimizzazione per mascherare, eliminare o nascondere in altro modo i dati. L'anonimizzazione ha diversi casi d'uso, tra cui:

Quando si condividono informazioni sanitarie con parti non autorizzate
Quando si creano set di dati da diverse fonti e li si analizzano
Quando è necessario anonimizzare i dati per utilizzarli in modelli di machine learning

Panoramica dell'anonimizzazione

L'anonimizzazione funziona ai seguenti livelli:

A livello di set di dati. L'anonimizzazione viene applicata a tutti i dati degli archivi DICOM e FHIR nel set di dati. Se un set di dati contiene sia istanze DICOM sia risorse FHIR, puoi anonimizzare tutte le istanze e le risorse contemporaneamente.

Per anonimizzare i dati sensibili a livello di set di dati, chiama il metodo datasets.deidentify dell'API Cloud Healthcare.
A livello di datastore FHIR. L'anonimizzazione viene applicata a tutti i dati di un archivio FHIR specifico in un set di dati.

Per anonimizzare i dati sensibili a livello di archivio FHIR, chiama il metodo fhirStores.deidentify dell'API Cloud Healthcare.
A livello di archivio DICOM. L'anonimizzazione viene applicata a tutti i dati di un determinato archivio DICOM in un set di dati.

Per anonimizzare i dati sensibili a livello di archivio DICOM, chiama il metodo dicomStores.deidentify dell'API Cloud Healthcare.

L'anonimizzazione non influisce sul set di dati originale, sull'archivio FHIR, sull'archivio DICOM o sui dati originali. A seconda di come configuri l'anonimizzazione, l'operazione si comporta nel seguente modo:

Se anonimizzi i dati a livello di set di dati, le copie anonimizzate dei dati originali vengono scritte in un nuovo set di dati chiamato set di dati di destinazione.
Se anonimizzi i dati a livello di archivio DICOM o FHIR, le copie anonimizzate dei dati originali vengono scritte in un archivio DICOM o FHIR esistente in un set di dati esistente. L'archivio DICOM e l'archivio FHIR di output sono chiamati rispettivamente archivio DICOM di destinazione e archivio FHIR di destinazione.

Il set di dati di origine, l'archivio FHIR o l'archivio DICOM e il set di dati di destinazione, l'archivio FHIR o l'archivio DICOM devono trovarsi nella stessa Google Cloud posizione. L'anonimizzazione dei dati su più Google Cloud posizioni non è supportata.

Posizione dell'anonimizzazione

Quando l'API Cloud Healthcare anonimizza i dati, questi potrebbero essere elaborati in una posizione diversa da quella in cui si trovano gli archivi FHIR o DICOM di origine e di destinazione. Al termine dell'anonimizzazione, i dati vengono archiviati nella stessa Google Cloud posizione dell'archivio FHIR o DICOM di origine.

Per assicurarti che i dati vengano elaborati nella stessa posizione dell'archivio FHIR o DICOM di origine, puoi specificare l'opzione useRegionalDataProcessing in DeidentifyConfig.

Anonimizzazione dei dati nella Google Cloud console

Puoi anonimizzare i dati di un set di dati, di uno store FHIR o di uno store DICOM dalla Google Cloud console. Per ulteriori informazioni, consulta Anonimizzazione dei dati nella Google Cloud console (DICOM) e Anonimizzazione dei dati nella Google Cloud console (FHIR).

Anonimizzazione DICOM

Un'istanza DICOM contiene un insieme di elementi di metadati chiave-valore (chiamati tag) e una o più immagini. L'operazione deidentify può rimuovere tag specifici che contengono dati sensibili, nonché utilizzare la funzione automatica di riconoscimento ottico dei caratteri (OCR) per oscurare il testo integrato delle immagini contenute nelle istanze DICOM.

Per esempi su come anonimizzare i dati DICOM, consulta Anonimizzazione dei dati DICOM.

Anonimizzazione FHIR

Ogni risorsa FHIR è un oggetto di tipo JSON che contiene elementi chiave-valore. Alcuni elementi sono standardizzati, mentre altri sono in testo libero. Puoi utilizzare l'operazione deidentify per ottenere uno dei seguenti risultati:

Rimuovere valori specifici nella risorsa
Elaborare parti di testo arbitrarie modo da rimuovere solo le sezioni sensibili, lasciando il resto dei dati così come è

Per esempi su come anonimizzare i dati FHIR, consulta Anonimizzazione dei dati FHIR.