Utiliser la traçabilité des données avec les systèmes Google Cloud

La traçabilité des données affiche les relations entre les ressources de votre projet et les processus qui les ont créées. Vous pouvez afficher des informations de traçabilité des données sous la forme d'une visualisation graphique ou sous forme de liste dans la console Google Cloud, ou les récupérer API Data Lineage sous forme de données JSON.

La traçabilité est capturée pour tous les projets. Lorsque vous affichez la traçabilité générée provenant de plusieurs projets, vous pouvez afficher les informations de traçabilité agrégées des projets pertinents.

Rôles et autorisations

Pour afficher les informations de traçabilité, demandez à votre administrateur de vous attribuer le rôle Lecteur comme décrit dans Rôles de traçabilité des données prédéfinis : Vous devez avoir accès au projet où vous affichez la traçabilité, ainsi qu'au projets dans lesquels la traçabilité est enregistrée.

Data Catalog suit automatiquement les informations de traçabilité lorsque vous activez l'API Data Lineage. Aucun rôle d'administrateur ou d'éditeur n'est nécessaire pour capturer la traçabilité pour votre éléments de données.

Pour en savoir plus sur l'attribution de rôles, consultez la section Gérer les accès. Vous pouvez attribuer un rôle à un niveau supérieur du dossier ou de l'organisation (voir Accorder ou révoquer un seul rôle)

Activer la traçabilité des données

Activez la traçabilité des données pour commencer à suivre automatiquement la traçabilité des informations sur systèmes compatibles. Vous devez activer l'API Data Lineage dans le projet où vous affichez la traçabilité et les projets dans lesquels elle est enregistrée. Pour en savoir plus, consultez la section Types de projets.

  1. Pour capturer des informations sur la lignée :

    1. Dans la console Google Cloud, sur la page Sélecteur de projet, sélectionnez le projet dans lequel vous souhaitez enregistrer la lignée.

      Accéder au sélecteur de projet

    2. Activez l'API Data Lineage.

      Activer l'API Data Lineage

    3. Répétez les étapes précédentes pour chaque projet dans lequel vous souhaitez enregistrer la lignée.
  2. Dans le projet où vous affichez la traçabilité, activez l'API Data Lineage et l'API Data Catalog.

    Activer les API

Afficher la traçabilité dans l'UI Dataplex

Vous pouvez afficher les informations de traçabilité des données dans l'interface utilisateur Dataplex sous la forme d'un un graphique ou une liste.

Les graphiques de traçabilité représentent les informations collectées par l'API Data Lineage pour un entrée spécifique.

Un exemple de graphique montre comment les données de deux tables sont transformées, puis fusionnées.
Figure 1. Exemple de graphique de visualisation de la traçabilité dans l'UI Dataplex

Affichage de la vue sous forme de liste de traçabilité (preview) des informations détaillées sur la traçabilité des entités table contenant des informations de traçabilité pour les entités comportant de nombreuses connexions.

Pour afficher la traçabilité, procédez comme suit:

  1. Ouvrez la page de recherche Dataplex et recherchez l'élément pour lequel pour afficher les informations de traçabilité.

    Ouvrir la page de recherche Dataplex

    Pour en savoir plus, consultez Rechercher des éléments de données.

  2. Sur la page d'informations de l'entrée, sélectionnez l'onglet Traçabilité.

  3. Sélectionnez les boutons de processus ou de source de données pour afficher le panneau d'informations.

  4. Pour afficher les informations de traçabilité en amont ou en aval d'une ressource, cliquez sur Développer.

  5. Pour afficher la généalogie sous forme de liste plutôt que de graphique, cliquez sur Liste.

Afficher la traçabilité dans l'UI BigQuery

Vous pouvez afficher les informations de traçabilité des données dans l'interface utilisateur de BigQuery sous la forme Un graphique ou une liste (aperçu)

Pour afficher la traçabilité, procédez comme suit:

  1. Dans la console Google Cloud, accédez à la page BigQuery.

    Ouvrir la page BigQuery

  2. Ouvrez la table dont vous souhaitez afficher la traçabilité des données.

  3. Cliquez sur l'onglet Tracé.

  4. Sélectionnez les boutons de processus ou de source de données pour afficher le panneau d'informations.

  5. Pour afficher les informations de traçabilité en amont ou en aval d'une ressource, cliquez sur Développer.

  6. Pour afficher la traçabilité sous forme de liste plutôt que sous forme de graphique, cliquez sur Liste.

Afficher la traçabilité dans l'interface utilisateur de Vertex AI

Les systèmes tels que Vertex AI Pipelines génèrent des données de traçabilité modèles et ensembles de données Vertex AI. Vous pouvez afficher les informations sur la traçabilité des données dans l'interface utilisateur de Vertex AI sous la forme d'un graphique ou d'une liste (Aperçu).

Afficher la traçabilité d'un ensemble de données géré dans Vertex AI

Pour afficher la lignée d'un ensemble de données, procédez comme suit :

  1. Dans la console Google Cloud, accédez à la page Ensembles de données.

    Ouvrir la page "Ensembles de données"

  2. Cliquez sur l'ensemble de données dont vous souhaitez afficher la traçabilité des données.

  3. Cliquez sur l'onglet Lignée.

  4. Sélectionnez les boutons de processus ou de source de données pour afficher le panneau d'informations.

  5. Pour afficher les informations de traçabilité en amont ou en aval d'une ressource, cliquez sur Développer.

  6. Pour afficher la généalogie sous forme de liste plutôt que de graphique, cliquez sur Liste.

Afficher la traçabilité d'un modèle dans Vertex AI

Pour afficher la traçabilité d'un modèle, procédez comme suit:

  1. Dans la console Google Cloud, accédez à la page Registre de modèles.

    Ouvrir la page Model Registry

  2. Cliquez sur le modèle dont vous souhaitez afficher la traçabilité des données.

  3. Cliquez sur l'onglet Tracé.

  4. Sélectionnez les boutons de processus ou de source de données pour afficher le panneau d'informations.

  5. Pour afficher les informations de traçabilité en amont ou en aval d'une ressource, cliquez sur Développer.

  6. Pour afficher la généalogie sous forme de liste plutôt que de graphique, cliquez sur Liste.

Étape suivante