跟踪流水线工件的沿袭

使用 Vertex AI Pipelines 运行流水线时,使用 Vertex ML Metadata 存储流水线运行的工件和参数。通过 Vertex ML Metadata,您可以降低跟踪流水线元数据的难度来轻松分析流水线工件的沿袭

工件的沿袭包括促使其创建的所有因素,以及从此工件派生的工件和元数据。例如,模型的沿袭可包括以下各项:

  • 用于创建模型的训练、测试和评估数据。
  • 模型训练期间使用的超参数。
  • 在训练和评估过程中记录的元数据,例如模型的准确率。
  • 源自该模型的工件,例如批量预测的结果。

您可以使用此元数据来帮助回答诸如以下问题:

  • 为什么某些流水线运行会产生特别准确的模型?
  • 哪次流水线运行产生的模型最准确,以及使用了哪些超参数来训练模型?
  • 根据流水线中的步骤,您或许可以使用 Vertex ML 元数据来回答系统治理问题。例如,您可以使用元数据来确定在给定时间点生产环境中的模型的版本。

如果您不熟悉 Vertex ML Metadata,请阅读 Vertex ML Metadata 简介

使用 Google Cloud Console 分析流水线工件的沿袭

使用以下说明查看 Google Cloud Console 中的流水线工件的沿袭图表。

  1. 在 Cloud Console 的 Vertex AI 部分中,转到元数据页面。

    转到元数据

    “元数据”页面列出了已在默认元数据存储区中创建的工件。

  2. 区域下拉列表中,选择在其中创建运行的区域。

  3. 点击工件的工件名称可查看其沿袭图表。

    系统会显示一个静态图标,其中显示属于此沿袭图表的工件和作业。

  4. 点击相应的工件或执行作业可了解详情。

后续步骤