Desidentificar datos sensibles

La desidentificación es el proceso de quitar información de identificación de los datos. La API de Cloud Healthcare detecta datos sensibles en instancias de DICOM y recursos de FHIR, como información de salud protegida (PHI) y, luego, usa una transformación de desidentificación para enmascarar, ocultar o borrar los datos. La desidentificación tiene varios casos de uso, incluidos los siguientes:

  • Cuando compartes información de salud con partes sin privilegios
  • Cuando creas conjuntos de datos de varias fuentes y los analizas
  • Cuando anonimizas los datos para que se puedan usar en modelos de aprendizaje automático

Descripción general de la desidentificación

La desidentificación funciona en los siguientes niveles:

  • Funciona en el nivel de conjunto de datos. La desidentificación ocurre en todos los datos de las tiendas de DICOM y de FHIR en el conjunto de datos. Si un conjunto de datos contiene instancias de DICOM y recursos de FHIR, puedes desidentificar todas las instancias y los recursos al mismo tiempo.

    Para desidentificar datos sensibles a nivel de conjunto de datos, llama al método datasets.deidentify de la API de Cloud Healthcare.
  • Funciona en el nivel de la tienda de FHIR. La desidentificación ocurre en todos los datos de una tienda de FHIR específica en un conjunto de datos.

    Para desidentificar datos sensibles a nivel de la tienda de FHIR, llama al método fhirStores.deidentify de la API de Cloud Healthcare.
  • Funciona en el nivel de la tienda de DICOM. La desidentificación ocurre en todos los datos de una tienda de DICOM específica en un conjunto de datos.

    Para desidentificar datos sensibles a nivel de la tienda de DICOM, llama al método dicomStores.deidentify de la API de Cloud Healthcare.

La desidentificación no afecta al conjunto de datos original, a la tienda de FHIR, a la tienda de DICOM ni a los datos originales. En función de cómo configures la desidentificación, la operación se comportará de la siguiente manera:

  • Si desidentificas datos a nivel de conjunto de datos, las copias desidentificadas de los datos originales se escribirán en un conjunto de datos nuevo llamado conjunto de datos de destino.
  • Si desidentificas datos a nivel de la tienda de DICOM o de FHIR, las copias desidentificadas de los datos originales se escribirán en una tienda de DICOM o de FHIR existente en un conjunto de datos existente. La tienda de DICOM y de FHIR de salida se denominan tienda de DICOM de destino y tienda de FHIR de destino, respectivamente.

El conjunto de datos, la tienda de FHIR o la tienda de DICOM de origen, y el conjunto de datos, la tienda de DICOM y la tienda de FHIR de destino deben estar en el mismo proyecto de Google Cloud. La desidentificación de datos no se admite en varios proyectos de Google Cloud.

Ubicación de desidentificación

Cuando la API de Cloud Healthcare desidentifica los datos, es posible que estos se procesen en una ubicación diferente de la ubicación en la que reside el almacén de FHIR o DICOM de origen y destino. Una vez finalizada la desidentificación, los datos se almacenan en la misma ubicación de Google Cloud que el almacén de FHIR de origen o el almacén de DICOM.

Desidentifica datos en la consola de Google Cloud

Puedes desidentificar datos para un conjunto de datos, un almacén FHIR o un almacén DICOM desde la consola de Google Cloud. Para obtener más información, consulta Desidentifica datos en la consola de Google Cloud (DICOM) y Desidentifica datos en la consola de Google Cloud (FHIR).