La traçabilité des données affiche les relations entre les ressources de votre projet et les processus qui les ont créées.
Vous pouvez afficher les informations sur la traçabilité des données dans la console Google Cloud sous les formes suivantes:
- Graphique de la lignée: affiche la lignée en amont ou en aval d'une seule entrée racine. Pour en savoir plus, consultez la section Graphique de traçabilité.
- Visualisation du chemin de traçabilité (Aperçu) : affiche les liens de traçabilité entre deux ressources sélectionnées. Pour en savoir plus, consultez la section Visualisation du chemin de traçabilité.
- Vue Liste de la traçabilité (Aperçu): affiche des informations détaillées sur la traçabilité des ressources dans un seul tableau, y compris des informations sur la traçabilité des ressources associées à de nombreuses connexions. Pour en savoir plus, consultez la section Vue de liste de la traçabilité des données.
Vous pouvez également récupérer des informations sur la lignée à partir de l'API Data Lineage sous la forme de données JSON.
La généalogie est capturée dans plusieurs projets. Lorsque vous affichez la lignée générée à partir de plusieurs projets, vous pouvez afficher les informations de lignée agrégées dans l'un des projets concernés.
Rôles et autorisations
Pour afficher des informations sur la traçabilité, demandez à votre administrateur de vous accorder des rôles de lecteur, comme décrit dans la section Rôles prédéfinis pour la traçabilité des données. Vous devez avoir accès au projet dans lequel vous consultez la lignée et aux projets dans lesquels elle est enregistrée.
Dataplex suit automatiquement les informations de la lignée lorsque vous activez l'API Data Lineage. Vous n'avez pas besoin de rôles Administrateur ou Éditeur pour capturer la lignée de vos composants de données.
Pour en savoir plus sur l'attribution de rôles, consultez la section Gérer les accès. Vous pouvez attribuer un rôle à un niveau de dossier ou d'organisation supérieur (voir la section Attribuer ou révoquer un rôle unique).
Activer la traçabilité des données
Activez la traçabilité des données pour commencer à suivre automatiquement les informations de traçabilité pour les systèmes compatibles. Vous devez activer l'API Data Lineage dans le projet dans lequel vous consultez la traçabilité et dans les projets dans lesquels elle est enregistrée. Pour en savoir plus, consultez la section Types de projets.
Pour capturer des informations sur la lignée:
-
Dans la console Google Cloud, sur la page Sélecteur de projet, sélectionnez le projet dans lequel vous souhaitez enregistrer la lignée.
Activez l'API Data Lineage.
- Répétez les étapes précédentes pour chaque projet dans lequel vous souhaitez enregistrer la lignée.
-
Dans le projet dans lequel vous consultez la traçabilité, activez l'API Data Lineage et l'API Dataplex.
Afficher la traçabilité dans Dataplex
Vous pouvez consulter des informations sur la traçabilité des données dans l'interface Web Dataplex.
Pour afficher la lignée, procédez comme suit:
Ouvrez la page de recherche du catalogue Dataplex et recherchez l'élément pour lequel vous souhaitez afficher des informations sur la lignée.
Pour en savoir plus, consultez Rechercher des ressources dans Dataplex Catalog.Sur la page d'informations sur l'entrée, sélectionnez l'onglet Lignée.
Pour afficher le graphique de traçabilité, cliquez sur Graphique.
Sélectionnez les boutons de processus ou de source de données pour afficher le panneau d'informations.
Pour afficher les informations de lignée en amont ou en aval d'une ressource, cliquez sur
Développer.
Pour afficher la lignée dans la vue Liste, cliquez sur Liste.
Pour afficher la visualisation du chemin de traçabilité, cliquez sur List (Liste), puis sélectionnez la ressource cible dans le tableau des résultats. Dans le panneau des détails, cliquez sur Cible, puis sur Visualiser la lignée.
Afficher la généalogie dans BigQuery
Vous pouvez afficher des informations sur la lignée des données dans l'interface Web de BigQuery.
Pour afficher la lignée, procédez comme suit:
- Dans la console Google Cloud, accédez à la page BigQuery.
Ouvrez la table pour laquelle vous souhaitez afficher la lignée des données.
Cliquez sur l'onglet Lignée.
Pour afficher le graphique de traçabilité, cliquez sur Graphique.
Sélectionnez les boutons de processus ou de source de données pour afficher le panneau d'informations.
Pour afficher les informations de lignée en amont ou en aval d'une ressource, cliquez sur
Développer.
Pour afficher la lignée dans la vue Liste, cliquez sur Liste.
Pour afficher la visualisation du chemin de traçabilité, cliquez sur List (Liste), puis sélectionnez la ressource cible dans le tableau des résultats. Dans le panneau des détails, cliquez sur Cible, puis sur Visualiser la lignée.
Afficher la traçabilité dans Vertex AI
Des systèmes tels que Vertex AI Pipelines génèrent des données de lignée pour les modèles et les ensembles de données Vertex AI. Vous pouvez consulter les informations sur la lignée des données dans l'interface Web de l'UI Vertex AI.
Afficher la généalogie d'un ensemble de données géré dans Vertex AI
Pour afficher la lignée d'un ensemble de données, procédez comme suit:
- Dans la console Google Cloud, accédez à la page Ensembles de données.
Cliquez sur l'ensemble de données pour lequel vous souhaitez afficher la lignée des données.
Cliquez sur l'onglet Lignée.
Pour afficher le graphique de traçabilité, cliquez sur Graphique.
Sélectionnez les boutons de processus ou de source de données pour afficher le panneau d'informations.
Pour afficher les informations de lignée en amont ou en aval d'une ressource, cliquez sur
Développer.
Pour afficher la lignée dans la vue Liste, cliquez sur Liste.
Pour afficher la visualisation du chemin de traçabilité, cliquez sur List (Liste), puis sélectionnez la ressource cible dans le tableau des résultats. Dans le panneau des détails, cliquez sur Cible, puis sur Visualiser la lignée.
Afficher la généalogie d'un modèle dans Vertex AI
Pour afficher la lignée d'un modèle, procédez comme suit:
Dans la console Google Cloud, accédez à la page Registre de modèles.
Cliquez sur le modèle pour lequel vous souhaitez afficher la lignée des données.
Cliquez sur l'onglet Lignée.
Pour afficher le graphique de traçabilité, cliquez sur Graphique.
Sélectionnez les boutons de processus ou de source de données pour afficher le panneau d'informations.
Pour afficher les informations de lignée en amont ou en aval d'une ressource, cliquez sur
Développer.
Pour afficher la lignée dans la vue Liste, cliquez sur Liste.
Pour afficher la visualisation du chemin de traçabilité, cliquez sur List (Liste), puis sélectionnez la ressource cible dans le tableau des résultats. Dans le panneau des détails, cliquez sur Cible, puis sur Visualiser la lignée.
Étape suivante
Suivez la lignée des données pour une copie de table BigQuery et des tâches de requête.
En savoir plus sur le modèle d'informations sur la traçabilité des données