您可以使用将 Cloud Billing 数据导出到 BigQuery 这一功能来查看流水线运行作业的费用。
您还可以使用流水线运行作业的唯一结算 ID 来查看该流水线运行作业创建的资源的费用,具体如下所示:
Vertex AI Pipelines 会自动将
vertex-ai-pipelines-run-billing-id
标签关联到您的流水线运行作业。此标签的值是您的流水线运行作业的唯一结算 ID。Vertex AI Pipelines 会将此标签传播到流水线组件在该流水线运行作业期间生成的 Google Cloud 资源。请注意,对于某些组件和资源,您需要升级 Google Cloud 流水线组件 SDK 或更新自己的组件代码才能传播标签。如需详细了解如何为 Google Cloud 资源加标签,请参阅 Vertex AI Pipelines 中的资源加标签功能。
vertex-ai-pipelines-run-billing-id
标签会在结算报告中关联流水线运行作业生成的 Google Cloud 资源的用量。有了此标签的值,您便可以使用将 Cloud Billing 数据导出到 BigQuery 这一功能来查看流水线运行作业中的资源使用费。
本页面介绍如何执行以下操作:
准备工作
在使用 Cloud Billing 了解流水线运行作业的费用之前,请按照以下说明设置您的 Google Cloud 项目和开发环境:
如需详细了解 Cloud Billing 标准使用费数据的架构,请参阅标准使用费数据的架构。
列出费用最高的前 10 个流水线运行作业
运行以下查询以查看指定时间段内费用最高的前 10 个流水线运行作业的列表:
标准 SQL
SELECT
project.id,
location.region,
L.value,
SUM(cost) AS total_cost
FROM
`project.dataset.gcp_billing_export_v1_XXXXXX_XXXXXX_XXXXXX` B,
UNNEST (B.labels) L
WHERE
DATE(_PARTITIONTIME) >= "START_DATE"
AND DATE(_PARTITIONTIME) < "END_DATE"
AND L.key = "vertex-ai-pipelines-run-billing-id"
GROUP BY
project.id,
location.region,
L.value
ORDER BY
total_cost DESC
LIMIT
10;
请替换以下内容:
START_DATE:时间段的开始日期。
END_DATE:时间段的结束日期。
您应该会在查询结果中看到如下列数据:
project_id
region
pipeline_run_billing_id
total_cost
现在,您可以使用查询结果的 pipeline_run_billing_id
列中的流水线运行作业唯一结算 ID 来执行以下操作:
使用结算 ID 查找流水线运行作业
您可以使用列出费用最高的前 10 个流水线运行作业部分的查询结果中的流水线运行作业唯一结算 ID 来查找流水线运行作业。
控制台
请按照以下说明在 Google Cloud 控制台中检索流水线运行作业。
在 Google Cloud 控制台的 Vertex AI 部分中,前往流水线页面。
如需查找流水线运行作业,请使用列出费用最高的前 10 个流水线运行作业部分的查询结果中的流水线运行作业唯一结算 ID 来过滤列表。为此,请按以下说明操作:
点击过滤条件,然后点击标签。
按以下格式输入流水线运行作业的唯一结算 ID,然后按 Enter 键:
labels.vertex-ai-pipelines-run-billing-id=PIPELINE_RUN_BILLING_ID
其中 PIPELINE_RUN_BILLING_ID 是流水线运行作业的唯一结算 ID。
Python 版 Vertex AI SDK
使用以下代码示例检索流水线运行作业:
runs = aip.PipelineJob.list(
project=PROJECT_ID,
location=LOCATION,
filter="labels.vertex-ai-pipelines-run-billing-id=PIPELINE_RUN_BILLING_ID")
请替换以下内容:
PROJECT_ID:在其中运行此流水线的 Google Cloud 项目。
LOCATION:流水线在其中运行的区域。如需详细了解支持 Vertex AI Pipelines 的区域,请参阅 Vertex AI 位置指南。
PIPELINE_RUN_BILLING_ID:列出费用最高的前 10 个流水线运行作业部分的查询结果中的流水线运行作业唯一结算 ID。
查看流水线运行作业中的 Google Cloud 资源的费用
您可以使用列出费用最高的前 10 个流水线运行作业部分的查询结果中的流水线运行作业唯一结算 ID 来查看该流水线运行作业生成的 Google Cloud 资源的费用。
运行以下查询,以查看流水线运行作业中生成的 Google Cloud 资源以及每项资源的费用的列表:
标准 SQL
SELECT
service,
sku,
cost
FROM
`project.dataset.gcp_billing_export_v1_XXXXXX_XXXXXX_XXXXXX` B,
UNNEST (B.labels) L
WHERE
DATE(_PARTITIONTIME) >= "START_DATE"
AND DATE(_PARTITIONTIME) < "END_DATE"
AND L.key = "vertex-ai-pipelines-run-billing-id"
AND L.value = "PIPELINE_RUN_BILLING_ID";
请替换以下内容:
START_DATE:时间段的开始日期。
END_DATE:时间段的结束日期。
PIPELINE_RUN_BILLING_ID:列出费用最高的前 10 个流水线运行作业部分的查询结果中的流水线运行作业唯一结算 ID。
您应该会在查询结果中看到如下列数据:
service.id
service.description
sku.id
sku_description
cost
cost
列表示与流水线运行作业中的 sku.id
相对应的资源的费用。