将数据沿袭与 Google Cloud 系统搭配使用

在 Google Cloud 项目中启用数据沿袭,以开始自动跟踪受支持的系统的沿袭信息。

角色与权限

启用 Data Lineage API 后,Data Catalog 会自动跟踪沿袭信息。您无需任何管理员角色或编辑者角色即可捕获数据资产的沿袭以及在 Google Cloud 控制台中访问沿袭。使用 Identity and Access Management 部分所述的标准 Viewer 角色就足够了。如需详细了解如何授予角色,请参阅管理访问权限。您可以在更高的文件夹或组织级层分配角色(请参阅授予或撤消单个角色)。

启用数据沿袭

  1. 在 Google Cloud 控制台中的项目选择器页面上,选择包含您要跟踪沿袭的资源的项目。

    转到“项目选择器”

  2. 启用 Data Lineage API 和 Data Catalog API。

    启用 API

在 Dataplex 界面中查看沿袭图

沿袭可视化图显示项目资源与创建这些资源的进程之间的关系。您可以在 Google Cloud 控制台中以直观的图表形式查看数据沿袭信息,也可以以 JSON 数据的形式从 Data Lineage API 中检索此类信息。

  1. 打开 Dataplex 搜索页面,然后找到要查看其沿袭信息的资产。

    打开 Dataplex 搜索页面

    如需了解详情,请参阅如何搜索数据资产

  2. 在条目详情页面上,选择沿袭标签页。

示例图表显示了两个表格的数据,这些表格接受转换然后合并。
图 1. Dataplex 界面中的沿袭可视化图示例。

选择进程或数据源按钮以显示详细信息面板。

在 BigQuery 界面中查看沿袭图

您可以直接在 BigQuery 界面中查看沿袭图。

  1. 在 Google Cloud 控制台中,前往 BigQuery 页面。

    打开 BigQuery 页面

  2. 打开要查看其数据沿袭的表。
  3. 点击沿袭标签页。
  4. 选择进程或数据源按钮以显示详细信息面板。

在 Vertex AI 界面中查看沿袭图

Vertex AI Pipelines 等系统会为 Vertex AI 模型和数据集生成沿袭数据。您可以直接在 Vertex AI 界面中查看沿袭图。

在 Vertex AI 中查看代管式数据集的沿袭图

如需查看数据集的沿袭图,请按照以下说明操作:

  1. 在 Google Cloud 控制台中,前往数据集页面。

    打开“数据集”页面

  2. 点击要查看其数据沿袭的数据集。
  3. 点击沿袭标签页。
  4. 选择进程或数据源按钮以显示详细信息面板。

在 Vertex AI 中查看模型的沿袭图

如需查看模型的沿袭图,请按照以下说明操作:

  1. 在 Google Cloud 控制台中,前往模型注册表页面。

    打开“模型注册表”页面

  2. 点击要查看其数据沿袭的模型。
  3. 点击沿袭标签页。
  4. 选择进程或数据源按钮以显示详细信息面板。

后续步骤