Accéder au contenu
Analyse de données

Gouvernance de données dans le cloud – Partie 1 – Des personnes et des processus

9 février 2022
Imad Qureshi

Customer Engineer, Google Cloud

Essayer GCP

Les nouveaux clients peuvent explorer et évaluer Google Cloud avec des conditions exceptionnelles.

Essayer

La gouvernance des données pour mieux gérer ses données dans le cloud, c’est ainsi que nous pourrions résumer ce nouveau billet de blog en deux parties. Celui-ci nous offre ainsi l’opportunité d’aborder non seulement le modèle opérationnel qui est indépendant des technologies - qu'elles soient sur site ou dans le cloud – mais également les processus permettant de garantir la gouvernance et, enfin, les technologies disponibles pour garantir une bonne gouvernance des données dans le cloud.

Dans cette première partie, nous souhaitons ainsi aborder le rôle de la gouvernance des données, les raisons de son importance et les processus à mettre en œuvre pour gérer un programme efficace.

Dans une seconde partie, nous nous plongerons dans les outils et les technologies disponibles pour mettre en œuvre différents processus de gouvernance des données tels que la qualité des données, la découverte des données, le suivi de l'historique et la sécurité.

Pour une approche plus approfondie et exhaustive de ce sujet, nous vous invitons à consulter notre guide Data Governance : People, Processes, and Tools to Operationalize Data Trustworthiness (Gouvernance des données : Les gens, les processus et les outils pour opérationnaliser la fiabilité des données) .

Qu'est-ce que la gouvernance des données ?

La gouvernance des données est une « fonction » de la gestion des données. D’une part, elle vise à créer de la valeur pour l'organisation en mettant en œuvre des processus pour garantir une qualité élevée des données. D’autre part, elle fournit une plateforme qui facilite le partage des données en toute sécurité dans l'organisation tout en garantissant la conformité avec les réglementations en vigueur.

Dit autrement, l'objectif principal de la gouvernance des données est à la fois de maximiser la valeur intrinsèque des données, d'instaurer la confiance des utilisateurs et de garantir la conformité en mettant en œuvre les mesures de sécurité requises.

Cette gouvernance des données doit être mise en place dès qu'une information est collectée ou générée et se prolonger jusqu'au moment où ces informations sont supprimées. Au cours de ce cycle de vie complet des données, leur gouvernance s'attache à les mettre à la disposition de toutes les parties prenantes de sorte qu’elles soient facilement accessibles, qu'elles puissent être utilisées de manière à générer les résultats business escomptés (informations, analyses) tout en se conformant aux normes réglementaires. Ces dernières sont souvent un croisement de règles et de codes de comportement émis par l'industrie (par exemple, les soins de santé), les gouvernements (par exemple, la vie privée) et l'entreprise elle-même (par exemple, pratiques non partisanes).

Pour plus de détails, cliquez ici.

Pourquoi la gouvernance des données est-elle importante ?

Au cours de la dernière décennie, la quantité de données générées par les utilisateurs depuis leurs téléphones mobiles, leurs dispositifs de santé ou de fitness et leurs appareils IOT, etc. a provoqué une croissance exponentielle des données. Dans le même temps, le cloud a facilité la collecte, le stockage et l'analyse de ces données à moindre coût. Alors que le volume de données et l'adoption du cloud continuent de croître, les organisations sont confrontées à un double défi : démocratiser et intégrer les données dans toutes les prises de décision mais aussi veiller à ce qu'elles soient sécurisées et protégées contre toute utilisation non autorisée.

Un programme efficace de gouvernance des données se révèle nécessaire pour relever ces défis d’une part en faisant en sorte que l'organisation soit centrée sur la donnée et, d'autre part, en protégeant les données contre toute utilisation non autorisée. Les organisations qui ne disposent pas d'un programme efficace de gouvernance seront à l’avenir confrontées à la fois à des violations de la conformité (entraînant des amendes), à une mauvaise qualité des données (qui se traduit par des informations de moindre qualité et donc de moindre pertinence pour le business de l’entreprise), à des difficultés pour trouver les bonnes données (ce qui retarde l'analyse et peut faire manquer des opportunités commerciales), à des modèles de données mal formés pour l'IA (ce qui réduit la précision des modèles et les avantages de l'utilisation de l'IA).

Une stratégie efficace de gouvernance des données englobe les personnes, les processus, les outils et les technologies. Elle favorise la démocratisation des données pour les intégrer dans toutes les prises de décision, renforce la confiance des utilisateurs, augmente la valeur de la marque, réduit les risques de violations de la conformité qui peuvent entraîner des amendes substantielles et des pertes d'activité.

De quoi se compose une vraie gouvernance des données ?

Les personnes et rôles dans la gouvernance des données

Un programme complet de gouvernance des données commence par la création d’un conseil de gouvernance composé de dirigeants représentant chaque unité métier de l'organisation. Ce conseil établit les grands principes directeurs régissant la façon dont les données seront utilisées pour prendre des décisions business.

En appui sur l’expertise de personnes clés de chaque métier, le conseil identifie les différents domaines de données (data domains) : par exemple client, produit, patient, fournisseur…. Puis, pour chaque domaine ainsi défini, il veille à attribuer les rôles de « propriétaires des données » (data ownership) et de « gérant des données » (data stewardship). Il s'agit de rôles fondamentaux : chaque élu est tenu responsable de - et récompensé en conséquence pour - la réalisation des objectifs fixés par le conseil de gouvernance des données. Les propriétaires et gérants des données sont désignés par les métiers. Typiquement, le propriétaire des données clients peut être issu du marketing ou des ventes, le propriétaire des données financières peut être issu du département financier et le propriétaire des données RH peut être issu du département Ressources Humaines.

La DSI joue quant à elle le rôle de gardien des données. Elle s'assure que les données sont acquises, protégées, stockées et partagées conformément aux politiques spécifiées par les propriétaires des données. En tant que dépositaire des données, la DSI ne prend pas les décisions concernant l'accès aux données ou leur partage. Son rôle se limite à gérer la technologie pour soutenir la mise en œuvre des politiques de gestion des données définies par les propriétaires des données.

Les processus de gouvernance des données

Chaque organisation doit mettre en place des processus pour atteindre les objectifs fixés par le conseil de gouvernance des données. Ces processus sont établis par les propriétaires des données et les gérants des données pour chacun de leurs domaines de données.

Les processus se focalisent sur les objectifs suivants :

1. La qualité des données. Les données doivent répondre aux normes de qualité spécifiées : par exemple, 98% d'exhaustivité, pas plus de 0,1% de valeurs en double, 99,99% de données cohérentes entre les différentes tables ou encore les critères pour mesurer une livraison dans les délais.

2. Les politiques de sécurité des données pour garantir la conformité aux politiques internes et externes.

  1. Les données sont chiffrées au repos comme lors des transferts.
  2. L'accès aux données est limité aux seuls utilisateurs autorisés.
  3. Tous les champs de données sensibles sont expurgés ou chiffrés/déchiffrés dynamiquement et uniquement pour les utilisateurs autorisés.
  4. Les données peuvent être jointes pour l'analyse sous une forme dépersonnalisée ou anonymisée, par exemple en utilisant un chiffrement déterministe ou un hachage.
  5. Des audits sont disponibles pour tous les accès autorisés ainsi que pour les tentatives d’accès non autorisés.

3. Le partage des données avec des partenaires externes est disponible en toute sécurité via des API.

4. La conformité avec les réglementations sectorielles et géographiques spécifiques, par exemple RGPD, HIPAA, PCI DSS, CCPA, LGPD.

5. La réplication des données qui doit être minimisée

6. La découverte centralisée des données pour les utilisateurs via des catalogues de données.

7. Le traçage de l'historique des données pour identifier les problèmes de qualité des données, les sources de réplication des données et faciliter les audits.

Les technologies

La mise en œuvre des processus tels que spécifiés dans le programme de gouvernance des données nécessite l'utilisation de technologies adéquates. Qu'il s'agisse de sécuriser les données, de conserver les audits et d'en faciliter l’analyse, ou d'automatiser la surveillance et les alertes, de multiples technologies doivent être intégrées à la plateforme de gouvernance pour gérer les données durant tout leur cycle de vie.

Google Cloud propose un ensemble complet d'outils permettant aux organisations de gérer leurs données en toute sécurité et de favoriser leur démocratisation. Data Catalog permet aux utilisateurs de trouver et retrouver facilement des données à partir d'un seul endroit centralisé dans Google Cloud. Data Fusion assure le suivi du lignage afin que les propriétaires de données puissent retracer les données à chaque étape de leur cycle de vie et résoudre les problèmes susceptibles de les corrompre. Cloud Audit Logs archive les audits nécessaires à la conformité. Dataplex fournit une gestion intelligente des données, une sécurité et une gouvernance centralisées, une découverte automatique des données, une collecte des métadonnées, une gestion du cycle de vie et une qualité des données grâce à une intelligence intégrée pilotée par l'IA.

Nous aborderons plus en détail, dans la seconde partie de ce billet de blog, l'utilisation de ces outils et technologies nécessaires à la mise en œuvre d’une gouvernance des données dans le cloud.

Publié dans