Suppression de l'identification des données

La suppression de l'identification permet de supprimer des informations personnelles dans des données. L'API Cloud Healthcare détecte les données sensibles dans les instances DICOM et les ressources FHIR, telles que les informations médicales protégées (PHI), puis utilise une transformation d'anonymisation visant à masquer, supprimer, ou dissimuler les données. L'anonymisation des données est appliquée dans plusieurs cas d'utilisation, y compris :

  • Lors du partage d'informations de santé avec des parties non privilégiées
  • Lors de la création et de l'analyse d'ensembles de données provenant de sources multiples
  • Lors de l'anonymisation des données, afin qu'elles puissent être utilisées dans des modèles de machine learning

Présentation de l'anonymisation

L'anonymisation des données est appliquée aux niveaux suivants :

  • Au niveau d'un ensemble de données. L'anonymisation des données est appliquée à toutes les données des datastores DICOM et FHIR existants dans un ensemble de données. Si un ensemble de données contient à la fois des instances DICOM et des ressources FHIR, vous pouvez effectuer l'anonymisation de toutes les instances et ressources simultanément.

    Pour anonymiser les données sensibles au niveau d'un ensemble de données, appelez la méthode datasets.deidentify de l'API Cloud Healthcare.
  • Au niveau d'un datastore FHIR. L'anonymisation des données est appliquée à toutes les données d'un datastore FHIR spécifique dans un ensemble de données.

    Pour anonymiser les données sensibles au niveau d'un datastore FHIR, appelez la méthode fhirStores.deidentify de l'API Cloud Healthcare.
  • Au niveau du datastore DICOM. L'anonymisation des données est appliquée à toutes les données d'un datastore DICOM spécifique dans un ensemble de données.

    Pour anonymiser les données sensibles au niveau d'un datastore DICOM, appelez la méthode dicomStores.deidentify de l'API Cloud Healthcare.

L'anonymisation des données n'a aucune incidence sur l'ensemble de données d'origine, le datastore FHIR, le datastore DICOM, ni sur les données d'origine. Selon la configuration de l'anonymisation, l'opération se déroule comme suit :

  • Si vous anonymisez les données au niveau de l'ensemble de données, les copies supprimées des données d'origine sont écrites dans un nouvel ensemble de données appelé ensemble de données de destination.
  • Si vous anonymisez les données au niveau d'un datastore DICOM ou FHIR, les copies supprimées des données d'origine sont écrites dans un datastore DICOM ou FHIR présent dans un ensemble de données existant. Le datastore DICOM de sortie et le datastore FHIR sont appelés respectivement datastore DICOM de destination et datastore FHIR de destination.

L'ensemble de données source, le magasin FHIR ou le magasin DICOM et l'ensemble de données de destination, le magasin FHIR ou le magasin DICOM doivent se trouver dans le même emplacement Google Cloud. Il n'est pas possible de supprimer l'identification de données appartenant à plusieurs emplacements Google Cloud.

Anonymiser des données dans Cloud Console

Vous pouvez anonymiser des données d'un ensemble de données, d'un magasin FHIR ou d'un magasin DICOM à partir de Cloud Console. Pour en savoir plus, consultez les pages Anonymiser des données dans Cloud Console (DICOM) et Anonymiser des données dans Cloud Console (FHIR).

Supprimer l'identification dans les données DICOM

Une instance DICOM comporte un ensemble d'éléments de métadonnées valeur/clé (également appelés "tags"), ainsi qu'une ou plusieurs images. L'opération deidentify peut supprimer des balises spécifiques contenant des données sensibles. Elle peut également utiliser la reconnaissance optique des caractères (OCR) automatique pour masquer le texte incrusté sur les images contenues dans les instances DICOM.

Pour obtenir des exemples d'anonymisation des données DICOM, consultez la section Anonymiser des données DICOM.

Supprimer l'identification dans les ressources FHIR

Chaque ressource FHIR est un objet de type JSON contenant des éléments valeur/clé. Certains éléments sont standardisés, tandis que d'autres sont en texte libre. Vous pouvez utiliser l'opération deidentify pour:

  • Supprimer des valeurs spécifiques dans la ressource

OU

  • Traiter les parties de texte arbitraires afin de ne supprimer que les parties sensibles, en laissant le reste des données tel quel

Pour obtenir des exemples d'anonymisation des données FHIR, consultez la page Anonymiser des données FHIR.