La desidentificación es el proceso de quitar información de identificación de los datos. La API de Cloud Healthcare detecta datos sensibles en instancias de DICOM y recursos de FHIR, como información de salud protegida (PHI) y, luego, usa una transformación de desidentificación para enmascarar, ocultar o borrar los datos. La desidentificación tiene varios casos de uso, incluidos los siguientes:
- Cuando compartes información de salud con partes sin privilegios
- Cuando creas conjuntos de datos de varias fuentes y los analizas
- Cuando anonimizas los datos para que se puedan usar en modelos de aprendizaje automático
Descripción general de la desidentificación
La desidentificación funciona en los siguientes niveles:
- Funciona en el nivel de conjunto de datos. La desidentificación ocurre en todos los datos de las tiendas de DICOM y de FHIR en el conjunto de datos. Si un conjunto de datos contiene instancias de DICOM y recursos de FHIR, puedes desidentificar todas las instancias y los recursos al mismo tiempo.
Para desidentificar datos sensibles a nivel de conjunto de datos, llama al métododatasets.deidentify
de la API de Cloud Healthcare. - Funciona en el nivel de la tienda de FHIR. La desidentificación ocurre en todos los datos de una tienda de FHIR específica en un conjunto de datos.
Para desidentificar datos sensibles a nivel de la tienda de FHIR, llama al métodofhirStores.deidentify
de la API de Cloud Healthcare. - Funciona en el nivel de la tienda de DICOM. La desidentificación ocurre en todos los datos de una tienda de DICOM específica en un conjunto de datos.
Para desidentificar datos sensibles a nivel de la tienda de DICOM, llama al métododicomStores.deidentify
de la API de Cloud Healthcare.
La desidentificación no afecta al conjunto de datos original, a la tienda de FHIR, a la tienda de DICOM ni a los datos originales. En función de cómo configures la desidentificación, la operación se comportará de la siguiente manera:
- Si desidentificas datos a nivel de conjunto de datos, las copias desidentificadas de los datos originales se escribirán en un conjunto de datos nuevo llamado conjunto de datos de destino.
- Si desidentificas datos a nivel de la tienda de DICOM o de FHIR, las copias desidentificadas de los datos originales se escribirán en una tienda de DICOM o de FHIR existente en un conjunto de datos existente. La tienda de DICOM y de FHIR de salida se denominan tienda de DICOM de destino y tienda de FHIR de destino, respectivamente.
El conjunto de datos, la tienda de FHIR o la tienda de DICOM de origen, y el conjunto de datos, la tienda de DICOM y la tienda de FHIR de destino deben estar en el mismo proyecto de Google Cloud. La desidentificación de datos no se admite en varios proyectos de Google Cloud.
Ubicación de desidentificación
Cuando la API de Cloud Healthcare desidentifica los datos, es posible que estos se procesen en una ubicación diferente de la ubicación en la que reside el almacén de FHIR o DICOM de origen y destino. Una vez finalizada la desidentificación, los datos se almacenan en la misma ubicación de Google Cloud que el almacén de FHIR de origen o el almacén de DICOM.
Desidentifica datos en la consola de Google Cloud
Puedes desidentificar datos para un conjunto de datos, un almacén FHIR o un almacén DICOM desde la consola de Google Cloud. Para obtener más información, consulta Desidentifica datos en la consola de Google Cloud (DICOM) y Desidentifica datos en la consola de Google Cloud (FHIR).
Desidentificación de DICOM
Una instancia de DICOM contiene un conjunto de elementos de metadatos de clave-valor (también conocidos como etiquetas) y una o más imágenes. La operación deidentify
puede quitar etiquetas específicas que contienen datos sensibles. La operación también puede usar el reconocimiento óptico de caracteres automatizado (OCR) para ocultar el texto quemado en las imágenes que contienen las instancias de DICOM.
Para ver ejemplos de cómo desidentificar datos DICOM, consulta Desidentifica los datos de DICOM.
Desidentificación de FHIR
Cada recurso de FHIR es un objeto similar a JSON que contiene elementos clave-valor.
Algunos elementos se estandarizaron, mientras que otros son textos libres. Puedes usar la operación deidentify
para lograr uno de los siguientes resultados:
Quita valores específicos del recurso
Procesa las partes de texto arbitrarias para quitar solo las partes sensibles y dejar el resto de los datos como están.
Para ver ejemplos de cómo desidentificar datos FHIR, consulta Desidentifica los datos de FHIR.