Anonymisation des données

La suppression de l'identification permet de supprimer des informations personnelles dans des données. L'API Cloud Healthcare détecte les données sensibles dans les instances DICOM et les ressources FHIR, telles que les informations médicales protégées (PHI), puis utilise une transformation d'anonymisation visant à masquer, supprimer, ou dissimuler les données. L'anonymisation des données est appliquée dans plusieurs cas d'utilisation, y compris :

  • Lors du partage d'informations de santé avec des parties non privilégiées
  • Lors de la création et de l'analyse d'ensembles de données provenant de sources multiples
  • Lors de l'anonymisation des données, afin qu'elles puissent être utilisées dans des modèles de machine learning

Présentation de l'anonymisation

L'anonymisation fonctionne aux niveaux suivants:

  • Au niveau d'un ensemble de données. L'anonymisation des données est appliquée à toutes les données des datastores DICOM et FHIR existants dans un ensemble de données. Si un ensemble de données contient à la fois des instances DICOM et des ressources FHIR, vous pouvez effectuer l'anonymisation de toutes les instances et ressources simultanément.

    Pour anonymiser les données sensibles au niveau d'un ensemble de données, appelez la méthode datasets.deidentify de l'API Cloud Healthcare.
  • Au niveau d'un datastore FHIR. L'anonymisation des données est appliquée à toutes les données d'un datastore FHIR spécifique dans un ensemble de données.

    Pour anonymiser les données sensibles au niveau d'un datastore FHIR, appelez la méthode fhirStores.deidentify de l'API Cloud Healthcare.
  • Au niveau du datastore DICOM. L'anonymisation des données est appliquée à toutes les données d'un datastore DICOM spécifique dans un ensemble de données.

    Pour anonymiser les données sensibles au niveau d'un datastore DICOM, appelez la méthode dicomStores.deidentify de l'API Cloud Healthcare.

L'anonymisation des données n'a aucune incidence sur l'ensemble de données d'origine, le datastore FHIR, le datastore DICOM, ni sur les données d'origine. Selon la configuration de l'anonymisation, l'opération se déroule comme suit :

  • Si vous anonymisez les données au niveau de l'ensemble de données, les copies supprimées des données d'origine sont écrites dans un nouvel ensemble de données appelé ensemble de données de destination.
  • Si vous anonymisez les données au niveau d'un datastore DICOM ou FHIR, les copies supprimées des données d'origine sont écrites dans un datastore DICOM ou FHIR présent dans un ensemble de données existant. Le datastore DICOM de sortie et le datastore FHIR sont appelés respectivement datastore DICOM de destination et datastore FHIR de destination.

L'ensemble de données, le datastore FHIR ou le datastore DICOM source et l'ensemble de données, le datastore FHIR ou le datastore DICOM de destination doivent résider dans le même emplacement Google Cloud. L'anonymisation des données sur plusieurs emplacements Google Cloud n'est pas possible.

Emplacement de l'anonymisation

Lorsque l'API Cloud Healthcare anonymise des données, celles-ci peuvent être traitées dans un emplacement différent de celui où se trouvent les magasins FHIR ou DICOM source et de destination. Une fois l'anonymisation terminée, les données sont stockées dans le même emplacement Google Cloud que le magasin FHIR ou DICOM source.

Anonymiser des données dans la console Google Cloud

Vous pouvez anonymiser des données d'un ensemble de données, d'un magasin FHIR ou d'un magasin DICOM à partir de la console Google Cloud. Pour en savoir plus, consultez les sections Anonymiser des données dans la console Google Cloud (DICOM) et Anonymiser des données dans la console Google Cloud (FHIR).

Supprimer l'identification dans les données DICOM

Une instance DICOM comporte un ensemble d'éléments de métadonnées valeur/clé (également appelés tags), ainsi qu'une ou plusieurs images. L'opération deidentify peut supprimer des tags spécifiques contenant des données sensibles. Elle peut également utiliser la reconnaissance optique des caractères (OCR) automatique pour masquer le texte incrusté sur les images contenues dans les instances DICOM.

Pour obtenir des exemples d'anonymisation des données DICOM, consultez la section Anonymiser des données DICOM.

Supprimer l'identification dans les ressources FHIR

Chaque ressource FHIR est un objet de type JSON contenant des éléments valeur/clé. Certains éléments sont standardisés, tandis que d'autres sont en texte libre. Vous pouvez obtenir l'un des résultats suivants à l'aide de l'opération deidentify :

  • Supprimer des valeurs spécifiques dans la ressource

  • Traiter les parties de texte arbitraires afin de ne supprimer que les parties sensibles, en laissant le reste des données tel quel

Pour obtenir des exemples d'anonymisation des données FHIR, consultez la page Anonymiser des données FHIR.