Utiliser la traçabilité des données avec les systèmes Google Cloud

Activer la traçabilité des données dans un projet Google Cloud pour commencer automatiquement et suivez les informations de traçabilité des systèmes compatibles.

<ph type="x-smartling-placeholder">

Rôles et autorisations

Data Catalog suit automatiquement les informations de traçabilité lorsque vous activez l'API Data Lineage. Vous n'avez pas besoin de rôles d'administrateur ou d'éditeur pour capturer la traçabilité de vos éléments de données et accéder à la traçabilité dans la console Google Cloud. Rôles de lecteur standards en tant que décrits dans le Identity and Access Management sont suffisants. Pour en savoir plus sur l'attribution de rôles, consultez la section Gérer l'accès. Vous pouvez attribuer un rôle à un niveau supérieur du dossier ou de l'organisation (voir Accorder ou révoquer un seul rôle)

Activer la traçabilité des données

  1. Dans la console Google Cloud, sur la page du sélecteur de projet, sélectionnez projet contenant les ressources dont vous souhaitez suivre la traçabilité.

    Accéder au sélecteur de projet

  2. Activer les API Data Lineage et Data Catalog

    Activer les API

Afficher les graphiques de traçabilité dans l'UI Dataplex

Le graphique de visualisation de la traçabilité affiche les relations entre les ressources de votre projet et les processus qui les ont créés. Vous pouvez afficher la traçabilité des données des informations sous la forme d'une visualisation graphique dans la console Google Cloud, ou les récupérer depuis l'API Data Lineage sous forme de données JSON.

  1. Ouvrez la page de recherche Dataplex et recherchez l'élément pour lequel pour afficher les informations de traçabilité.

    Ouvrir la page de recherche Dataplex

    Pour en savoir plus, consultez Rechercher des éléments de données.

  2. Sur la page d'informations de l'entrée, sélectionnez l'onglet Traçabilité.

Un exemple de graphique montre les données de deux tables en cours de transformation, puis de fusion. <ph type="x-smartling-placeholder">
</ph> Figure 1 : Exemple de graphique de visualisation de la traçabilité dans l'UI Dataplex

Sélectionnez les boutons de processus ou de source de données pour afficher le panneau de détails.

Afficher les graphiques de traçabilité dans l'UI de BigQuery

Vous pouvez afficher un graphique de traçabilité directement dans l'interface utilisateur de BigQuery.

  1. Dans la console Google Cloud, accédez à la page BigQuery.

    Ouvrir la page BigQuery

  2. Ouvrez la table dont vous souhaitez afficher la traçabilité des données.
  3. Cliquez sur l'onglet Tracé.
  4. Sélectionnez les boutons de processus ou de source de données pour afficher le panneau de détails.

Afficher les graphiques de traçabilité dans l'interface utilisateur de Vertex AI

Les systèmes tels que Vertex AI Pipelines génèrent des données de traçabilité modèles et ensembles de données Vertex AI. Vous pouvez afficher directement le graphique de traçabilité dans l'interface utilisateur de Vertex AI.

Afficher les graphiques de traçabilité d'un ensemble de données géré dans Vertex AI

Pour afficher le graphique de traçabilité d'un ensemble de données, procédez comme suit:

  1. Dans la console Google Cloud, accédez à la page Ensembles de données.

    Ouvrir la page "Ensembles de données"

  2. Cliquez sur l'ensemble de données dont vous souhaitez afficher la traçabilité des données.
  3. Cliquez sur l'onglet Tracé.
  4. Sélectionnez les boutons de processus ou de source de données pour afficher le panneau de détails.

Afficher les graphiques de traçabilité d'un modèle dans Vertex AI

Pour afficher le graphique de traçabilité d'un modèle, procédez comme suit:

  1. Dans la console Google Cloud, accédez à la page Registre de modèles.

    Ouvrir la page Model Registry

  2. Cliquez sur le modèle dont vous souhaitez afficher la traçabilité des données.
  3. Cliquez sur l'onglet Tracé.
  4. Sélectionnez les boutons de processus ou de source de données pour afficher le panneau de détails.

Étape suivante