La traçabilité des données est activée par projet. Cela signifie qu'une fois l'API Data Lineage activée, les informations de traçabilité peuvent être automatiquement signalées pour plusieurs systèmes en fonction la traçabilité au niveau du produit.
Le suivi de la traçabilité automatique est disponible pour les systèmes suivants:
Système | Commandes de traçabilité disponibles |
---|---|
BigQuery, Cloud Data Fusion |
Aucune configuration ne permet de limiter le suivi de la traçabilité à Cloud Data Fusion uniquement ou BigQuery lorsque l'API Data Lineage est activée dans un projet. |
Cloud Composer | Cloud Composer utilise la traçabilité des données au niveau de l'environnement le contrôle de l'intégration. La traçabilité des données pour tous les nouveaux environnements Cloud Composer, à condition qu'ils respectent les exigences. Voir <ph type="x-smartling-placeholder"></ph> Traçabilité des données avec Dataplex des informations. Pour les environnements existants, vous pouvez activer ou désactiver l'intégration de la traçabilité des données dans les paramètres de l'environnement. |
Dataproc | Les jobs Spark Dataproc peuvent capturer les événements de traçabilité et les publier dans l'API Data Lineage. Pour en savoir plus, consultez la section Intégration de la traçabilité des données dans Dataproc. |
Vertex AI | La traçabilité des données est automatiquement activée pour les artefacts et paramètres Vertex AI, tels que les modèles, les ensembles de données, les modèles de pipeline et les composants. La traçabilité d'un pipeline comprend les facteurs qui ont contribué à sa création, ainsi que les artefacts et les métadonnées dérivés par la suite. Pour en savoir plus, consultez la section Suivre la traçabilité des artefacts de pipeline. |
Impact sur la facturation
Lorsque vous activez l'API Data Lineage dans un projet, consultez l'impact sur vos frais de facturation puisque l'API Data Lineage est activée par projet (voir la section précédente pour plus de détails).
Pour les emplacements multirégionaux, tels que l'Union européenne (UE), l'Asie (asia), et aux États-Unis (us), et pour BigQuery Omni, le traitement de la traçabilité est distribué dans des régions spécifiques, et les coûts dépendent des régions dans lesquelles le traitement est effectué (consultez les exemples de tarification pour Data Catalog).
Conformité de la traçabilité des données
- La traçabilité des données enregistre des métadonnées sur le transfert des données, mais ne capture pas les données elles-mêmes. Reportez-vous au modèle d'information sur la traçabilité des données et Documentation de référence de l'API Data Lineage pour en savoir plus sur les champs inclus dans les métadonnées.
- La traçabilité des données dans Dataplex est compatible avec VPC-SC.
- Dataplex ne permet pas d'utiliser Clés de chiffrement gérées par le client pour protéger les métadonnées de traçabilité collectées.
Limites de la traçabilité des données
Lorsque vous sélectionnez un nœud dans le graphique de traçabilité, le panneau latéral des détails du nœud s'affiche est vide lorsque:
- si les ressources sont situées dans une autre organisation ;
- l'utilisateur n'est pas membre de l'organisation qui héberge la ressource.