了解流水线运行作业的费用

您可以使用将 Cloud Billing 数据导出到 BigQuery 这一功能来查看流水线运行作业的费用。

您还可以使用流水线运行作业的唯一结算 ID 来查看该流水线运行作业创建的资源的费用,具体如下所示:

  1. Vertex AI Pipelines 会自动将 vertex-ai-pipelines-run-billing-id 标签关联到您的流水线运行作业。此标签的值是您的流水线运行作业的唯一结算 ID。

  2. Vertex AI Pipelines 会将此标签传播到流水线组件在该流水线运行作业期间生成的 Google Cloud 资源。请注意,对于某些组件和资源,您需要升级 Google Cloud 流水线组件 SDK 或更新自己的组件代码才能传播标签。如需详细了解如何为 Google Cloud 资源加标签,请参阅 Vertex AI Pipelines 中的资源加标签功能

  3. vertex-ai-pipelines-run-billing-id 标签会在结算报告中关联流水线运行作业生成的 Google Cloud 资源的用量。有了此标签的值,您便可以使用将 Cloud Billing 数据导出到 BigQuery 这一功能来查看流水线运行作业中的资源使用费。

本页面介绍如何执行以下操作:

准备工作

在使用 Cloud Billing 了解流水线运行作业的费用之前,请按照以下说明设置您的 Google Cloud 项目和开发环境:

如需详细了解 Cloud Billing 标准使用费数据的架构,请参阅标准使用费数据的架构

列出费用最高的前 10 个流水线运行作业

运行以下查询以查看指定时间段内费用最高的前 10 个流水线运行作业的列表:

标准 SQL

SELECT
  project.id,
  location.region,
  L.value,
  SUM(cost) AS total_cost
FROM
  `project.dataset.gcp_billing_export_v1_XXXXXX_XXXXXX_XXXXXX` B,
  UNNEST (B.labels) L
WHERE
  DATE(_PARTITIONTIME) >= "START_DATE"
  AND DATE(_PARTITIONTIME) < "END_DATE"
  AND L.key = "vertex-ai-pipelines-run-billing-id"
GROUP BY
  project.id,
  location.region,
  L.value
ORDER BY
  total_cost DESC
LIMIT
  10;

请替换以下内容:

  • START_DATE:时间段的开始日期。

  • END_DATE:时间段的结束日期。

您应该会在查询结果中看到如下列数据:

  • project_id

  • region

  • pipeline_run_billing_id

  • total_cost

现在,您可以使用查询结果的 pipeline_run_billing_id 列中的流水线运行作业唯一结算 ID 来执行以下操作:

使用结算 ID 查找流水线运行作业

您可以使用列出费用最高的前 10 个流水线运行作业部分的查询结果中的流水线运行作业唯一结算 ID 来查找流水线运行作业。

控制台

请按照以下说明在 Google Cloud 控制台中检索流水线运行作业。

  1. 在 Google Cloud 控制台的 Vertex AI 部分中,前往流水线页面。

    打开“流水线”

  2. 如需查找流水线运行作业,请使用列出费用最高的前 10 个流水线运行作业部分的查询结果中的流水线运行作业唯一结算 ID 来过滤列表。为此,请按以下说明操作:

    1. 点击过滤条件,然后点击标签

    2. 按以下格式输入流水线运行作业的唯一结算 ID,然后按 Enter 键:
      labels.vertex-ai-pipelines-run-billing-id=PIPELINE_RUN_BILLING_ID
      其中 PIPELINE_RUN_BILLING_ID 是流水线运行作业的唯一结算 ID。

Python 版 Vertex AI SDK

使用以下代码示例检索流水线运行作业:

runs = aip.PipelineJob.list(
  project=PROJECT_ID,
  location=LOCATION,
  filter="labels.vertex-ai-pipelines-run-billing-id=PIPELINE_RUN_BILLING_ID")

请替换以下内容:

查看流水线运行作业中的 Google Cloud 资源的费用

您可以使用列出费用最高的前 10 个流水线运行作业部分的查询结果中的流水线运行作业唯一结算 ID 来查看该流水线运行作业生成的 Google Cloud 资源的费用。

运行以下查询,以查看流水线运行作业中生成的 Google Cloud 资源以及每项资源的费用的列表:

标准 SQL

SELECT
  service,
  sku,
  cost
FROM
  `project.dataset.gcp_billing_export_v1_XXXXXX_XXXXXX_XXXXXX` B,
  UNNEST (B.labels) L
WHERE
  DATE(_PARTITIONTIME) >=  "START_DATE"
  AND DATE(_PARTITIONTIME) <  "END_DATE"
  AND L.key = "vertex-ai-pipelines-run-billing-id"
  AND L.value = "PIPELINE_RUN_BILLING_ID";

请替换以下内容:

您应该会在查询结果中看到如下列数据:

  • service.id

  • service.description

  • sku.id

  • sku_description

  • cost

cost 列表示与流水线运行作业中的 sku.id 相对应的资源的费用。