在 Google Cloud 系统中使用数据沿袭

在 Google Cloud 项目中启用数据沿袭,以开始自动跟踪受支持的系统的沿袭信息。

角色与权限

启用 Data Lineage API 后,Data Catalog 会自动跟踪沿袭信息。您无需任何 Admin 或 Editor 角色即可在 Google Cloud 控制台中捕获数据资产的沿袭以及访问沿袭。身份和访问权限管理部分中所述的标准查看者角色足以满足需求。如需详细了解如何授予角色,请参阅管理访问权限。您可以在更高的文件夹或组织级层分配角色(请参阅授予或撤消单个角色)。

启用数据沿袭

  1. 在 Google Cloud 控制台的项目选择器页面上,选择包含您要跟踪沿袭的资源的项目。

    转到“项目选择器”

  2. 启用 Data Lineage API 和 Data Catalog API。

    启用 API

在 Dataplex 界面中查看沿袭图

沿袭可视化图可显示项目资源与创建这些资源的进程之间的关系。您可以在 Google Cloud 控制台中以图表的形式查看数据沿袭信息,也可以从 Data Lineage API 中以 JSON 数据的形式检索这些信息。

  1. 打开 Dataplex 搜索页面,找到要查看其沿袭信息的资产。

    打开 Dataplex 搜索页面

    如需了解详情,请参阅如何搜索数据资产

  2. 在条目详情页面上,选择沿袭标签页。

一个示例图表显示了两个表的数据,它们分别经过转换和合并。
图 1. Dataplex 界面中的沿袭可视化图示例。

选择流程或数据源按钮以显示详细信息面板。

在 BigQuery 界面中查看沿袭图

您可以直接在 BigQuery 界面中查看沿袭图。

  1. 在 Google Cloud 控制台中,前往 BigQuery 页面。

    打开 BigQuery 页面

  2. 打开要查看其数据沿袭的表。
  3. 点击沿袭标签页。
  4. 选择流程或数据源按钮以显示详细信息面板。

在 Vertex AI 界面中查看沿袭图

Vertex AI Pipelines 等系统会为 Vertex AI 模型和数据集生成沿袭数据。您可以直接在 Vertex AI 界面中查看沿袭图。

在 Vertex AI 中查看代管式数据集的沿袭图

如需查看数据集的沿袭图,请按照以下说明操作:

  1. 在 Google Cloud 控制台中,前往数据集页面。

    打开“数据集”页面

  2. 点击要查看其数据沿袭的数据集。
  3. 点击沿袭标签页。
  4. 选择流程或数据源按钮以显示详细信息面板。

在 Vertex AI 中查看模型的沿袭图

如需查看模型的沿袭图,请按照以下说明操作:

  1. 在 Google Cloud 控制台中,转到模型注册表页面。

    打开 Model Registry 页面

  2. 点击要查看其数据沿袭的模型。
  3. 点击沿袭标签页。
  4. 选择流程或数据源按钮以显示详细信息面板。

后续步骤