使用表格工作流训练模型时,您需要根据基础架构和相关服务的费用付费。使用此模型进行预测时,您需要根据基础架构的费用付费。
基础架构的费用取决于以下因素:
- 您使用的机器数量。您可以在模型训练、批量预测或在线预测期间设置相关的参数。
- 您使用的机器类型。您可以在模型训练、批量预测或在线预测期间设置此参数。
- 机器使用的时长。
- 如果您要训练模型或进行批量预测,则此指标衡量的是操作的总处理时间。
- 如果您要进行在线预测,则此指标衡量的模型部署到端点的时间。
表格工作流会代表您运行项目中的多个依赖服务:Dataflow、BigQuery、Cloud Storage、Vertex AI Pipelines、Vertex AI Training。这些服务会直接向您收取费用。
训练费用计算示例
示例 1:CSV 格式的 110MB 数据集采用默认硬件配置训练一小时。
使用架构搜索和训练的默认工作流费用明细如下:
服务 | 费用 |
---|---|
Dataflow 示例和统计信息生成 | $2(Dataflow 运行了 7 分钟) |
Dataflow 数据和特征转换 | $3(Dataflow 运行了 10 分钟) |
Vertex AI Training | 0.8 小时 x $20 + 0.2 小时 x $20 + $3.3 SSD 费用 + 流水线容器费用 = $24(48 分钟调节,12 分钟训练) |
Vertex AI Pipelines | 1 次运行 x $0.03 = $0.03 |
总计(不包括模型精馏) | $27.03 |
(可选)您可以启用模型精馏以减小生成的模型大小。费用明细如下:
服务 | 费用 |
---|---|
总计(不包括模型精馏) | $27.03 |
用于模型精馏的 Vertex AI Training | $1 |
用于模型精馏的 Dataflow 数据、特征转换 | $3(Dataflow 运行了 10 分钟) |
用于模型精馏的批量预测结果 | $7 |
总计(包括模型精馏) | $38.03 |
示例 2:BigQuery 中的 1.84TB 数据集采用硬件替换训练 20 小时。
此示例的硬件配置如下:
硬件配置名称 | 值 |
---|---|
stats_and_example_gen_dataflow_machine_type | n1-standard-16 |
stats_and_example_gen_dataflow_max_num_workers | 100 |
stats_and_example_gen_dataflow_disk_size_gb | 40 |
transform_dataflow_machine_type | n1-standard-16 |
transform_dataflow_max_num_workers | 100 |
transform_dataflow_disk_size_gb | 200 |
distill_batch_predict_machine_type | n1-standard-2 |
distill_batch_predict_starting_replica_count | 200 |
distill_batch_predict_max_replica_count | 200 |
使用架构搜索和训练的默认工作流费用明细如下:
服务 | 费用 |
---|---|
Dataflow 示例和统计信息生成 | $518(Dataflow 运行了 6 小时) |
Dataflow 数据、特征转换 | $471(Dataflow 运行了 6 小时) |
Vertex AI Training | 17 小时 x $20 + 3 小时 x $20 + $41.5 SSD 费用 + 流水线容器费用 = $555(17 小时调整,3 小时训练) |
Vertex AI Pipelines | 1 次运行 x $0.03 = $0.03 |
总计 | $1544.03 |