在 Google Cloud 系统中使用数据沿袭

数据沿袭会显示项目资源与创建这些资源的流程之间的关系。您可以在 Google Cloud 控制台中以图表可视化或列表视图的形式查看数据谱系信息,也可以从 Data Lineage API 检索 JSON 数据形式的数据谱系信息。

跨项目捕获沿袭。当您查看生成的沿袭时 查看来自多个项目的汇总沿袭信息 相关项目的限制

角色与权限

如需查看数据沿袭信息,请让管理员向您授予查看者角色,如预定义的数据沿袭角色中所述。您必须对查看沿袭的项目以及 记录沿袭的项目。

启用后,Data Catalog 会自动跟踪沿袭信息 Data Lineage API。 您无需任何管理员或编辑者角色即可为您的 数据资产。

如需详细了解如何授予角色 请参阅管理访问权限。 您可以在更高级别的文件夹或组织级别分配角色(请参阅 授予或撤消单个角色)。

启用数据沿袭

启用数据传承功能,开始自动跟踪受支持的系统的传承信息。您必须在要查看的项目中启用 Data Lineage API 沿袭以及记录沿袭的项目。如需了解详情,请参阅 项目类型

  1. 如需捕获谱系信息,请执行以下操作:

    1. 在 Google Cloud 控制台的项目选择器页面上,选择您要记录谱系的项目。

      前往“项目选择器”

    2. 启用 Data Lineage API。

      启用 Data Lineage API

    3. 针对需要执行上述操作的每个项目重复上述步骤 记录沿袭。
  2. 在您查看谱系的项目中,启用 Data Lineage API 和 Data Catalog API。

    启用 API

在 Dataplex 界面中查看沿袭

您可以在 Dataplex 界面中以如下形式查看数据沿袭信息: 图表或列表。

沿袭图表示 Data Lineage API 为特定条目收集的信息。

一个示例图表显示了两个表的数据,它们分别经过转换和合并。
图 1. Dataplex 界面中的谱系可视化图表示例。

谱系列表视图(预览版)会在一个表格中显示实体的详细谱系信息,其中包含具有多个关联的实体的谱系信息。

如需查看谱系,请按以下说明操作:

  1. 打开 Dataplex 搜索页面,找到需要关联的资产 您想要查看沿袭信息。

    打开 Dataplex 搜索页面

    如需了解详情,请参阅如何搜索数据资产

  2. 在条目详情页面上,选择谱系标签页。

  3. 选择流程或数据源按钮以显示详细信息面板。

  4. 要查看资源的上行或下行沿袭信息,请点击 展开

  5. 如需在列表视图(而非图表视图)中查看谱系,请点击列表

在 BigQuery 界面中查看沿袭

您可以在 BigQuery 界面中以图表或列表的形式查看数据谱系信息(预览版)。

如需查看谱系,请按以下说明操作:

  1. 在 Google Cloud 控制台中,前往 BigQuery 页面。

    打开 BigQuery 页面

  2. 打开要查看其数据沿袭的表。

  3. 点击沿袭标签页。

  4. 选择流程或数据源按钮以显示详细信息面板。

  5. 要查看资源的上行或下行沿袭信息,请点击 展开

  6. 如需在列表视图(而非图表视图)中查看谱系,请点击列表

在 Vertex AI 界面中查看沿袭

Vertex AI Pipelines 等系统可生成沿袭数据, Vertex AI 模型和数据集。您可以在 Vertex AI 界面中以图表或列表的形式查看数据谱系信息(预览版)。

在 Vertex AI 中查看代管式数据集的谱系

如需查看数据集的沿袭,请按照以下说明操作:

  1. 在 Google Cloud 控制台中,前往数据集页面。

    打开“数据集”页面

  2. 点击要查看其数据谱系的数据集。

  3. 点击沿袭标签页。

  4. 选择流程或数据源按钮以显示详细信息面板。

  5. 要查看资源的上行或下行沿袭信息,请点击 展开

  6. 如需在列表视图(而不是图表视图)中查看沿袭,请点击列表

在 Vertex AI 中查看模型的谱系

如需查看模型的沿袭,请按照以下说明操作:

  1. 在 Google Cloud 控制台中,前往 Model Registry 页面。

    打开 Model Registry 页面

  2. 点击您要查看其数据谱系的模型。

  3. 点击沿袭标签页。

  4. 选择流程或数据源按钮以显示详细信息面板。

  5. 要查看资源的上行或下行沿袭信息,请点击 展开

  6. 如需在列表视图(而不是图表视图)中查看沿袭,请点击列表

后续步骤