所列价格以美元 (USD) 为单位。 如果您使用非美元货币付费,请参阅 Cloud Platform SKU 上以您的币种列出的价格。
Vertex AI 的费用与被其取代的旧版 AI Platform 和 AutoML 产品的费用相同,但以下情况除外:
Vertex AI 还提供了更多优化成本的方法,比如:
如需 Vertex AI 上的生成式 AI 的价格信息,请参阅 Vertex AI 上的生成式 AI 的价格。
对于 Vertex AI AutoML 模型,您需要为三类主要活动付费:
Vertex AI 使用 Vertex AutoML 模型的预定义机器配置,这些活动的每小时费率反映了资源使用情况。
训练模型所需的时间取决于训练数据的规模和复杂程度。您必须先部署模型,然后模型才能提供在线预测或在线解释。
即使模型未进行预测,您也需要为部署到端点的每个模型付费。如需避免模型产生进一步的费用,您必须取消部署模型。未部署或部署失败的模型不会产生费用。
您只需为实际使用的计算小时数付费;如果训练因用户自行取消之外的原因而失败,您不需要为相应训练时间付费。如果您取消操作,则需要按训练时间付费。
请从下方选择一种模型类型以获取价格信息。
图片数据
操作 | 价格(分类)(美元) | 价格(对象检测)(USD) |
---|---|---|
训练 | US$3.465 / 1 hour | US$3.465 / 1 hour |
训练(Edge 设备端模型) | US$18.00 / 1 hour | US$18.00 / 1 hour |
部署和在线预测 | US$1.375 / 1 hour | US$2.002 / 1 hour |
批量预测 | US$2.222 / 1 hour | US$2.222 / 1 hour |
表格数据
操作 | 每节点时价格(分类/回归) | 预测价格 |
---|---|---|
训练 | US$21.252 / 1 hour | |
预测 | 价格与自定义训练模型预测价格相同。 Vertex AI 使用 40 台 n1-highmem-8 机器执行批量预测。 |
Vertex Explainable AI 的预测费用
与 Vertex Explainable AI 关联的计算按照与预测相同的费率计费。但解释要比正常的预测花费更长的时间,因此大量使用 Vertex Explainable AI 以及自动扩缩可能导致启动更多节点,这将增加预测费用。
AutoML
阶段 | 价格 |
---|---|
预测 | 0 count to 1,000,000 count US$0.20 / 1,000 count, per 1 month / account 1,000,000 count to 50,000,000 count US$0.10 / 1,000 count, per 1 month / account 50,000,000 count and above US$0.02 / 1,000 count, per 1 month / account |
训练 | US$21.252 / 1 hour |
Explainable AI | 使用 Shapley 值实现可解释性。请参阅 Vertex AI 推理和解释 价格页面。 |
* 预测数据点是预测范围内的一个时间点。例如,如果粒度按天计算,7 天的范围为每个时序 7 个点。
ARIMA+
阶段 | 价格 |
---|---|
预测 | US$5.00 / 1,000 count |
训练 | 每 TB$250.00 x 候选模型数量 x 回测窗口数量* |
Explainable AI | 使用时序分解来实现可解释性无需额外付费。不支持使用 Shapley 值实现可解释性。 |
请参阅 BigQuery ML 价格页面 了解更多详情。如 Vertex AI 价格中所述,每项训练和预测作业都会产生 1 次托管式流水线运行的费用。
* 测试集内的每个时段都会创建一个回测窗口。候选模型的数量由使用的 AUTO_ARIMA_MAX_ORDER 决定。对于有多个时序的模型,数量范围在 6-42 之间。
培训
下表提供了各种训练配置的大致每小时价格。您可以选择采用由所选机器类型组成的自定义配置。如需计算价格,请将您使用的虚拟机的费用相加。
如果您使用 Compute Engine 机器类型并挂接加速器,则加速器的费用需另外计算。如需计算此费用,请将下表中加速器的价格乘以您使用的每种加速器类型的机器小时数。
机器类型
您可以将 Spot 虚拟机用于 Vertex AI 自定义训练。Spot 虚拟机的费用根据 Compute Engine Spot 虚拟机价格计算。除基础设施使用费之外,还需支付 Vertex AI 自定义训练管理费,详情见以下表格。
您可以将 Compute Engine 预留与 Vertex AI 自定义训练搭配使用。使用 Compute Engine 预留时,您需要按照 Compute Engine 价格付费,包括所有适用的承诺使用折扣 (CUD)。除基础设施使用费之外,还需支付 Vertex AI 自定义训练管理费,详情见以下表格。
机器类型 | 价格 (USD) |
---|---|
n1-standard-4 | US$0.21849885 / 1 hour |
n1-standard-8 | US$0.4369977 / 1 hour |
n1-standard-16 | US$0.8739954 / 1 hour |
n1-standard-32 | US$1.7479908 / 1 hour |
n1-standard-64 | US$3.4959816 / 1 hour |
n1-standard-96 | US$5.2439724 / 1 hour |
n1-highmem-2 | US$0.13604845 / 1 hour |
n1-highmem-4 | US$0.2720969 / 1 hour |
n1-highmem-8 | US$0.5441938 / 1 hour |
n1-highmem-16 | US$1.0883876 / 1 hour |
n1-highmem-32 | US$2.1767752 / 1 hour |
n1-highmem-64 | US$4.3535504 / 1 hour |
n1-highmem-96 | US$6.5303256 / 1 hour |
n1-highcpu-16 | US$0.65180712 / 1 hour |
n1-highcpu-32 | US$1.30361424 / 1 hour |
n1-highcpu-64 | US$2.60722848 / 1 hour |
n1-highcpu-96 | US$3.91084272 / 1 hour |
a2-highgpu-1g* | US$4.425248914 / 1 hour |
a2-highgpu-2g* | US$8.850497829 / 1 hour |
a2-highgpu-4g* | US$17.700995658 / 1 hour |
a2-highgpu-8g* | US$35.401991315 / 1 hour |
a2-megagpu-16g* | US$65.707278915 / 1 hour |
a3-highgpu-8g* | US$101.007352 / 1 hour |
a3-megagpu-8g* | US$106.0464232 / 1 hour |
a3-ultragpu-8g* | US$99.7739296 / 1 hour |
a4-highgpu-8g* | - |
e2-standard-4 | US$0.154126276 / 1 hour |
e2-standard-8 | US$0.308252552 / 1 hour |
e2-standard-16 | US$0.616505104 / 1 hour |
e2-standard-32 | US$1.233010208 / 1 hour |
e2-highmem-2 | US$0.103959618 / 1 hour |
e2-highmem-4 | US$0.207919236 / 1 hour |
e2-highmem-8 | US$0.415838472 / 1 hour |
e2-highmem-16 | US$0.831676944 / 1 hour |
e2-highcpu-16 | US$0.455126224 / 1 hour |
e2-highcpu-32 | US$0.910252448 / 1 hour |
n2-standard-4 | US$0.2233714 / 1 hour |
n2-standard-8 | US$0.4467428 / 1 hour |
n2-standard-16 | US$0.8934856 / 1 hour |
n2-standard-32 | US$1.7869712 / 1 hour |
n2-standard-48 | US$2.6804568 / 1 hour |
n2-standard-64 | US$3.5739424 / 1 hour |
n2-standard-80 | US$4.467428 / 1 hour |
n2-highmem-2 | US$0.1506661 / 1 hour |
n2-highmem-4 | US$0.3013322 / 1 hour |
n2-highmem-8 | US$0.6026644 / 1 hour |
n2-highmem-16 | US$1.2053288 / 1 hour |
n2-highmem-32 | US$2.4106576 / 1 hour |
n2-highmem-48 | US$3.6159864 / 1 hour |
n2-highmem-64 | US$4.8213152 / 1 hour |
n2-highmem-80 | US$6.026644 / 1 hour |
n2-highcpu-16 | US$0.6596032 / 1 hour |
n2-highcpu-32 | US$1.3192064 / 1 hour |
n2-highcpu-48 | US$1.9788096 / 1 hour |
n2-highcpu-64 | US$2.6384128 / 1 hour |
n2-highcpu-80 | US$3.298016 / 1 hour |
c2-standard-4 | US$0.2401292 / 1 hour |
c2-standard-8 | US$0.4802584 / 1 hour |
c2-standard-16 | US$0.9605168 / 1 hour |
c2-standard-30 | US$1.800969 / 1 hour |
c2-standard-60 | US$3.601938 / 1 hour |
m1-ultramem-40 | US$7.237065 / 1 hour |
m1-ultramem-80 | US$14.47413 / 1 hour |
m1-ultramem-160 | US$28.94826 / 1 hour |
m1-megamem-96 | US$12.249984 / 1 hour |
cloud-tpu | 价格取决于加速器类型。请参阅“加速器”。 |
*此金额包含 GPU 价格,因为此实例类型始终需要固定数量的 GPU 加速器。
如果您使用非美元货币付费,请参阅 Cloud Platform SKU 上以您的币种列出的价格。
加速器
机器类型 | 价格 (USD) | Vertex 管理费 |
---|---|---|
NVIDIA_TESLA_A100 | US$2.933908 / 1 hour | US$0.4400862 / 1 hour |
NVIDIA_TESLA_A100_80GB | US$3.92808 / 1 hour | US$0.589212 / 1 hour |
NVIDIA_H100_80GB | US$9.79655057 / 1 hour | US$1.4694826 / 1 hour |
NVIDIA_H200_141GB | US$10.708501 / 1 hour | 不可用 |
NVIDIA_H100_MEGA_80GB | US$11.8959171 / 1 hour | 不可用 |
NVIDIA_TESLA_L4 | US$0.644046276 / 1 hour | 不可用 |
NVIDIA_TESLA_P4 | US$0.69 / 1 hour | 不可用 |
NVIDIA_TESLA_P100 | US$1.679 / 1 hour | 不可用 |
NVIDIA_TESLA_T4 | US$0.4025 / 1 hour | 不可用 |
NVIDIA_TESLA_V100 | US$2.852 / 1 hour | 不可用 |
TPU_V2 单个(8 个核心) | US$5.175 / 1 hour | 不可用 |
TPU_V2 Pod(32 核)* | US$27.60 / 1 hour | 不可用 |
TPU_V3 单个(8 个核心) | US$9.20 / 1 hour | 不可用 |
TPU_V3 Pod(32 核)* | US$36.80 / 1 hour | 不可用 |
如果您使用非美元货币付费,请参阅 Cloud Platform SKU 上以您的币种列出的价格。
* 使用 Cloud TPU Pod 训练的价格基于 Pod 的核心数计算。Pod 的核心数始终都是 32 的倍数。要确定核心数超过 32 的 Pod 的训练价格,用 32 核 Pod 的价格乘以核心数再除以 32 即可。例如,对于 128 核的 Pod,价格是(32 核 Pod 的价格)* (128/32)。如需了解特定区域可用的 Cloud TPU Pod,请参阅 Cloud TPU 文档中的系统架构。
磁盘
机器类型 | 价格 (USD) |
---|---|
pd-standard | US$0.000063014 / 1 gibibyte hour |
pd-ssd | US$0.000267808 / 1 gibibyte hour |
如果您使用非美元货币付费,请参阅 Cloud Platform SKU 上以您的币种列出的价格。
训练模型的计费从您为某项作业预配资源开始到该作业结束为止。
警告:训练作业受 Vertex AI 配额政策的约束。如果您为首批训练作业选择了非常强大的处理集群,可能会超出您的配额。
预定义配置的规模层级 (AI Platform Training)
您可以控制在训练模型时使用的处理集群类型。最简单的方法是选择称为“规模层级”的其中一种预定义配置。详细了解规模层级。
自定义配置的机器类型
如果您使用 Vertex AI 或选择 CUSTOM 作为 AI Platform Training 的规模层级,则可以控制用于集群主实例、工作器和参数服务器的虚拟机数量和类型。详细了解适用于 Vertex AI 的机器类型和适用于 AI Platform Training 的机器类型。
使用自定义处理集群进行训练的费用等于您指定的所有机器的费用总和。您需要按作业总时间支付费用,而不是按单个机器的实际处理时间付费。
对于基于模型的指标,仅收取与底层自动评估器模型相关的预测费用。费用根据您在评估数据集中提供的输入词元和自动评分器输出计算。
Gen AI Evaluation Service 已正式发布 (GA)。价格变更已于 2025 年 4 月 14 日生效。
公制 | 价格 |
---|---|
逐点 | 默认自动评分器模型 Gemini 2.0 Flash |
成对 | 默认自动评分器模型 Gemini 2.0 Flash |
基于计算的指标按每 1,000 个输入字符 $0.00003 和每 1,000 个输出字符 $0.00009 收费。它们在 SKU 中称为“自动指标”。
指标名称 | 类型 |
---|---|
完全匹配 | 基于计算 |
Bleu | 基于计算 |
Rouge | 基于计算 |
工具调用有效 | 基于计算 |
工具名称匹配 | 基于计算 |
工具参数键匹配 | 基于计算 |
工具参数 KV 匹配 | 基于计算 |
所列价格以美元 (USD) 为单位。 如果您使用非美元货币付费,请参阅 Cloud Platform SKU 上以您的币种列出的价格。
基于旧模型的指标按输入每 1,000 个字符 $0.005 和输出每 1,000 个字符 $0.015 收费。
指标名称 | 类型 |
---|---|
连贯性 | 逐点 |
流畅度 | 逐点 |
履行情况 | 逐点 |
安全 | 逐点 |
接地性 | 逐点 |
总结质量 | 逐点 |
摘要实用性 | 逐点 |
摘要详细程度 | 逐点 |
问答质量 | 逐点 |
问答相关性 | 逐点 |
问答实用性 | 逐点 |
问答正确性 | 逐点 |
成对摘要质量 | 成对 |
成对问答质量 | 成对 |
所列价格以美元 (USD) 为单位。 如果您使用非美元货币付费,请参阅 Cloud Platform SKU 上以您的币种列出的价格。
价格取决于部署到 Agent Engine 托管式运行时的智能体所使用的计算(vCPU 小时)和内存(GiB 小时)资源。
资源 | 价格 (USD) |
---|---|
vCPU | US$0.0994 / 1 hour |
RAM | US$0.0105 / 1 gibibyte hour |
培训
下表提供了各种训练配置的大致每小时价格。您可以选择采用由所选机器类型组成的自定义配置。如需计算价格,请将您使用的虚拟机的费用相加。
如果您使用 Compute Engine 机器类型并挂接加速器,则加速器的费用需另外计算。如需计算此费用,请将下表中加速器的价格乘以您使用的每种加速器类型的机器小时数。
机器类型
机器类型 | 价格 (USD) |
---|---|
n1-standard-4 | US$0.2279988 / 1 hour |
n1-standard-8 | US$0.4559976 / 1 hour |
n1-standard-16 | US$0.9119952 / 1 hour |
n1-standard-32 | US$1.8239904 / 1 hour |
n1-standard-64 | US$3.6479808 / 1 hour |
n1-standard-96 | US$5.4719712 / 1 hour |
n1-highmem-2 | US$0.1419636 / 1 hour |
n1-highmem-4 | US$0.2839272 / 1 hour |
n1-highmem-8 | US$0.5678544 / 1 hour |
n1-highmem-16 | US$1.1357088 / 1 hour |
n1-highmem-32 | US$2.2714176 / 1 hour |
n1-highmem-64 | US$4.5428352 / 1 hour |
n1-highmem-96 | US$6.8142528 / 1 hour |
n1-highcpu-16 | US$0.68014656 / 1 hour |
n1-highcpu-32 | US$1.36029312 / 1 hour |
n1-highcpu-64 | US$2.72058624 / 1 hour |
n1-highcpu-96 | US$4.08087936 / 1 hour |
a2-highgpu-1g* | US$4.408062 / 1 hour |
a2-highgpu-2g* | US$8.816124 / 1 hour |
a2-highgpu-4g* | US$17.632248 / 1 hour |
a2-highgpu-8g* | US$35.264496 / 1 hour |
a2-highgpu-16g* | US$70.528992 / 1 hour |
a3-highgpu-8g* | US$105.39898088 / 1 hour |
a3-megagpu-8g* | US$110.65714224 / 1 hour |
a4-highgpu-8g* | US$148.212 / 1 hour |
e2-standard-4 | US$0.16082748 / 1 hour |
e2-standard-4 | US$0.32165496 / 1 hour |
e2-standard-16 | US$0.64330992 / 1 hour |
e2-standard-32 | US$1.28661984 / 1 hour |
e2-highmem-2 | US$0.10847966 / 1 hour |
e2-highmem-4 | US$0.21695932 / 1 hour |
e2-highmem-8 | US$0.43391864 / 1 hour |
e2-highmem-16 | US$0.86783728 / 1 hour |
e2-highcpu-16 | US$0.4749144 / 1 hour |
e2-highcpu-32 | US$0.9498288 / 1 hour |
n2-standard-4 | US$0.2330832 / 1 hour |
n2-standard-8 | US$0.4661664 / 1 hour |
n2-standard-16 | US$0.9323328 / 1 hour |
n2-standard-32 | US$1.8646656 / 1 hour |
n2-standard-48 | US$2.7969984 / 1 hour |
n2-standard-64 | US$3.7293312 / 1 hour |
n2-standard-80 | US$4.661664 / 1 hour |
n2-highmem-2 | US$0.1572168 / 1 hour |
n2-highmem-4 | US$0.3144336 / 1 hour |
n2-highmem-8 | US$0.6288672 / 1 hour |
n2-highmem-16 | US$1.2577344 / 1 hour |
n2-highmem-32 | US$2.5154688 / 1 hour |
n2-highmem-48 | US$3.7732032 / 1 hour |
n2-highmem-64 | US$5.0309376 / 1 hour |
n2-highmem-80 | US$6.288672 / 1 hour |
n2-highcpu-16 | US$0.6882816 / 1 hour |
n2-highcpu-32 | US$1.3765632 / 1 hour |
n2-highcpu-48 | US$2.0648448 / 1 hour |
n2-highcpu-64 | US$2.7531264 / 1 hour |
n2-highcpu-80 | US$3.441408 / 1 hour |
c2-standard-4 | US$0.2505696 / 1 hour |
c2-standard-8 | US$0.5011392 / 1 hour |
c2-standard-16 | US$1.0022784 / 1 hour |
c2-standard-30 | US$1.879272 / 1 hour |
c2-standard-60 | US$3.758544 / 1 hour |
m1-ultramem-40 | US$7.55172 / 1 hour |
m1-ultramem-80 | US$15.10344 / 1 hour |
m1-ultramem-160 | US$30.20688 / 1 hour |
m1-megamem-96 | US$12.782592 / 1 hour |
cloud-tpu | 价格取决于加速器类型。请参阅“加速器”。 |
如果您使用非美元货币付费,请参阅 Cloud Platform SKU 上以您的币种列出的价格。
加速器
GPU 类型 | 价格 (USD) |
---|---|
NVIDIA_TESLA_A100 | US$3.5206896 / 1 hour |
NVIDIA_TESLA_A100_80GB | US$4.517292 / 1 hour |
NVIDIA_H100_80GB | US$11.75586073 / 1 hour |
NVIDIA_TESLA_P4 | US$0.72 / 1 hour |
NVIDIA_TESLA_P100 | US$1.752 / 1 hour |
NVIDIA_TESLA_T4 | US$0.42 / 1 hour |
NVIDIA_TESLA_V100 | US$2.976 / 1 hour |
TPU_V2 单个(8 个核心) | US$5.40 / 1 hour |
TPU_V2 Pod(32 核)* | US$28.80 / 1 hour |
TPU_V3 单个(8 个核心) | US$9.60 / 1 hour |
TPU_V3 Pod(32 核)* | US$38.40 / 1 hour |
如果您使用非美元货币付费,请参阅 Cloud Platform SKU 上以您的币种列出的价格。
* 使用 Cloud TPU Pod 训练的价格基于 Pod 的核心数计算。Pod 的核心数始终都是 32 的倍数。要确定核心数超过 32 的 Pod 的训练价格,用 32 核 Pod 的价格乘以核心数再除以 32 即可。例如,对于 128 核的 Pod,价格是(32 核 Pod 的价格)* (128/32)。如需了解特定区域可用的 Cloud TPU Pod,请参阅 Cloud TPU 文档中的系统架构。
磁盘
磁盘类型 | 价格 (USD) |
---|---|
pd-standard | US$0.000065753 / 1 gibibyte hour |
pd-ssd | US$0.000279452 / 1 gibibyte hour |
如果您使用非美元货币付费,请参阅 Cloud Platform SKU 上以您的币种列出的价格。
训练模型的计费从您为某项作业预配资源开始到该作业结束为止。
警告:训练作业受 Vertex AI 配额政策的约束。如果您为首批训练作业选择了非常强大的处理集群,可能会超出您的配额。
下表提供了批量预测、在线预测和在线解释的每“节点时”价格。“节点时”表示虚拟机运行预测作业花费的时间,或者处于活跃状态(部署了一个或多个模型的端点)等待处理预测或解释请求的时间。
您可以将 Spot 虚拟机与 Vertex AI Inference 搭配使用。Spot 虚拟机的费用根据 Compute Engine Spot 虚拟机价格计算。除了基础设施使用费之外,还需支付 Vertex AI 推理管理费,详情见以下表格。
您可以将 Compute Engine 预留与 Vertex AI Inference 搭配使用。使用 Compute Engine 预留时,您需要按照 Compute Engine 价格付费,包括所有适用的承诺使用折扣 (CUD)。除了基础设施使用费之外,还需支付 Vertex AI 推理管理费,详情见以下表格。
E2 系列
机器类型 | 价格 (USD) |
---|---|
e2-standard-2 | US$0.0770564 / 1 hour |
e2-standard-4 | US$0.1541128 / 1 hour |
e2-standard-8 | US$0.3082256 / 1 hour |
e2-standard-16 | US$0.6164512 / 1 hour |
e2-standard-32 | US$1.2329024 / 1 hour |
e2-highmem-2 | US$0.1039476 / 1 hour |
e2-highmem-4 | US$0.2078952 / 1 hour |
e2-highmem-8 | US$0.4157904 / 1 hour |
e2-highmem-16 | US$0.8315808 / 1 hour |
e2-highcpu-2 | US$0.056888 / 1 hour |
e2-highcpu-4 | US$0.113776 / 1 hour |
e2-highcpu-8 | US$0.227552 / 1 hour |
e2-highcpu-16 | US$0.455104 / 1 hour |
e2-highcpu-32 | US$0.910208 / 1 hour |
N1 系列
机器类型 | 价格 (USD) |
---|---|
n1-standard-2 | US$0.1095 / 1 hour |
n1-standard-4 | US$0.219 / 1 hour |
n1-standard-8 | US$0.438 / 1 hour |
n1-standard-16 | US$0.876 / 1 hour |
n1-standard-32 | US$1.752 / 1 hour |
n1-highmem-2 | US$0.137 / 1 hour |
n1-highmem-4 | US$0.274 / 1 hour |
n1-highmem-8 | US$0.548 / 1 hour |
n1-highmem-16 | US$1.096 / 1 hour |
n1-highcpu-2 | US$0.081 / 1 hour |
n1-highcpu-4 | US$0.162 / 1 hour |
n1-highcpu-8 | US$0.324 / 1 hour |
n1-highcpu-16 | US$0.648 / 1 hour |
n1-highcpu-32 | US$1.296 / 1 hour |
N2 系列
机器类型 | 价格 (USD) |
---|---|
n2-standard-2 | US$0.1116854 / 1 hour |
n2-standard-4 | US$0.2233708 / 1 hour |
n2-standard-8 | US$0.4467416 / 1 hour |
n2-standard-16 | US$0.8934832 / 1 hour |
n2-standard-32 | US$1.7869664 / 1 hour |
n2-highmem-2 | US$0.1506654 / 1 hour |
n2-highmem-4 | US$0.3013308 / 1 hour |
n2-highmem-8 | US$0.6026616 / 1 hour |
n2-highmem-16 | US$1.2053232 / 1 hour |
n2-highcpu-2 | US$0.0824504 / 1 hour |
n2-highcpu-4 | US$0.1649008 / 1 hour |
n2-highcpu-8 | US$0.3298016 / 1 hour |
n2-highcpu-16 | US$0.6596032 / 1 hour |
n2-highcpu-32 | US$1.3192064 / 1 hour |
N2D 系列
机器类型 | 价格 (USD) |
---|---|
n2d-standard-2 | US$0.0971658 / 1 hour |
n2d-standard-4 | US$0.1943316 / 1 hour |
n2d-standard-8 | US$0.3886632 / 1 hour |
n2d-standard-16 | US$0.7773264 / 1 hour |
n2d-standard-32 | US$1.5546528 / 1 hour |
n2d-highmem-2 | US$0.131077 / 1 hour |
n2d-highmem-4 | US$0.262154 / 1 hour |
n2d-highmem-8 | US$0.524308 / 1 hour |
n2d-highmem-16 | US$1.048616 / 1 hour |
n2d-highcpu-2 | US$0.0717324 / 1 hour |
n2d-highcpu-4 | US$0.1434648 / 1 hour |
n2d-highcpu-8 | US$0.2869296 / 1 hour |
n2d-highcpu-16 | US$0.5738592 / 1 hour |
n2d-highcpu-32 | US$1.1477184 / 1 hour |
C2 系列
机器类型 | 价格 (USD) |
---|---|
c2-standard-4 | US$0.240028 / 1 hour |
c2-standard-8 | US$0.480056 / 1 hour |
c2-standard-16 | US$0.960112 / 1 hour |
c2-standard-30 | US$1.80021 / 1 hour |
c2-standard-60 | US$3.60042 / 1 hour |
C2D 系列
机器类型 | 价格 (USD) |
---|---|
c2d-standard-2 | US$0.1044172 / 1 hour |
c2d-standard-4 | US$0.2088344 / 1 hour |
c2d-standard-8 | US$0.4176688 / 1 hour |
c2d-standard-16 | US$0.8353376 / 1 hour |
c2d-standard-32 | US$1.6706752 / 1 hour |
c2d-standard-56 | US$2.9236816 / 1 hour |
c2d-standard-112 | US$5.8473632 / 1 hour |
c2d-highmem-2 | US$0.1408396 / 1 hour |
c2d-highmem-4 | US$0.2816792 / 1 hour |
c2d-highmem-8 | US$0.5633584 / 1 hour |
c2d-highmem-16 | US$1.1267168 / 1 hour |
c2d-highmem-32 | US$2.2534336 / 1 hour |
c2d-highmem-56 | US$3.9435088 / 1 hour |
c2d-highmem-112 | US$7.8870176 / 1 hour |
c2d-highcpu-2 | US$0.086206 / 1 hour |
c2d-highcpu-4 | US$0.172412 / 1 hour |
c2d-highcpu-8 | US$0.344824 / 1 hour |
c2d-highcpu-16 | US$0.689648 / 1 hour |
c2d-highcpu-32 | US$1.379296 / 1 hour |
c2d-highcpu-56 | US$2.413768 / 1 hour |
c2d-highcpu-112 | US$4.827536 / 1 hour |
C3 系列
机器类型 | 价格 (USD) |
---|---|
c3-highcpu-4 | US$0.19824 / 1 hour |
c3-highcpu-8 | US$0.39648 / 1 hour |
c3-highcpu-22 | US$1.09032 / 1 hour |
c3-highcpu-44 | US$2.18064 / 1 hour |
c3-highcpu-88 | US$4.36128 / 1 hour |
c3-highcpu-176 | US$8.72256 / 1 hour |
A2 系列
机器类型 | 价格 (USD) |
---|---|
a2-highgpu-1g | US$4.2244949 / 1 hour |
a2-highgpu-2g | US$8.4489898 / 1 hour |
a2-highgpu-4g | US$16.8979796 / 1 hour |
a2-highgpu-8g | US$33.7959592 / 1 hour |
a2-megagpu-16g | US$64.1020592 / 1 hour |
a2-ultragpu-1g | US$5.7818474 / 1 hour |
a2-ultragpu-2g | US$11.5636948 / 1 hour |
a2-ultragpu-4g | US$23.1273896 / 1 hour |
a2-ultragpu-8g | US$46.2547792 / 1 hour |
当使用预留容量或 Spot 容量时,结算会涉及两个 SKU:带有“vertex-ai-online-prediction”标签的 GCE SKU 和 Vertex AI Management Fee SKU。这样一来,您就可以在 Vertex AI 中使用承诺使用折扣 (CUD)。
A3 系列
机器类型 | 价格 (USD) |
---|---|
a3-ultragpu-8g | US$96.015616 / 1 hour |
a3-megagpu-8g | US$106.65474 / 1 hour |
当使用预留容量或 Spot 容量时,结算会涉及两个 SKU:带有“vertex-ai-online-prediction”标签的 GCE SKU 和 Vertex AI Management Fee SKU。这样一来,您就可以在 Vertex AI 中使用承诺使用折扣 (CUD)。
A4 系列
机器类型 | 价格 (USD) |
---|---|
a4-highgpu-8g | US$148.212 / 1 hour |
当使用预留容量或 Spot 容量时,结算会涉及两个 SKU:带有“vertex-ai-online-prediction”标签的 GCE SKU 和 Vertex AI Management Fee SKU。这样一来,您就可以在 Vertex AI 中使用承诺使用折扣 (CUD)。
A4X 系列
机器类型 | 价格 (USD) |
---|---|
a4x-highgpu-4g | US$74.75 / 1 hour |
当使用预留容量或 Spot 容量时,结算会涉及两个 SKU:带有“vertex-ai-online-prediction”标签的 GCE SKU 和 Vertex AI Management Fee SKU。这样一来,您就可以在 Vertex AI 中使用承诺使用折扣 (CUD)。
a4x-highgpu-4g 至少需要 18 个虚拟机。
G2 系列
机器类型 | 价格 (USD) |
---|---|
g2-standard-4 | US$0.81293 / 1 hour |
g2-standard-8 | US$0.98181 / 1 hour |
g2-standard-12 | US$1.15069 / 1 hour |
g2-standard-16 | US$1.31957 / 1 hour |
g2-standard-24 | US$2.30138 / 1 hour |
g2-standard-32 | US$1.99509 / 1 hour |
g2-standard-48 | US$4.60276 / 1 hour |
g2-standard-96 | US$9.20552 / 1 hour |
当使用预留容量或 Spot 容量时,结算会涉及两个 SKU:带有“vertex-ai-online-prediction”标签的 GCE SKU 和 Vertex AI Management Fee SKU。这样一来,您就可以在 Vertex AI 中使用承诺使用折扣 (CUD)。
TPU v5e 价格
机器类型 | 价格 (USD) |
---|---|
ct5lp-hightpu-1t | US$1.38 / 1 hour |
ct5lp-hightpu-4t | US$5.52 / 1 hour |
ct5lp-hightpu-8t | US$5.52 / 1 hour |
E2 系列
计费项 | 价格 (USD) |
---|---|
vCPU | US$0.0250826 / 1 hour |
RAM | US$0.0033614 / 1 gibibyte hour |
N1 系列
计费项 | 价格 (USD) |
---|---|
vCPU | US$0.036 / 1 hour |
RAM | US$0.005 / 1 gibibyte hour |
N2 系列
计费项 | 价格 (USD) |
---|---|
vCPU | US$0.0363527 / 1 hour |
RAM | US$0.0048725 / 1 gibibyte hour |
N2D 系列
计费项 | 价格 (USD) |
---|---|
vCPU | US$0.0316273 / 1 hour |
RAM | US$0.0042389 / 1 gibibyte hour |
C2 系列
计费项 | 价格 (USD) |
---|---|
vCPU | US$0.039077 / 1 hour |
RAM | US$0.0052325 / 1 gibibyte hour |
C2D 系列
计费项 | 价格 (USD) |
---|---|
vCPU | US$0.0339974 / 1 hour |
RAM | US$0.0045528 / 1 gibibyte hour |
C3 系列
计费项 | 价格 (USD) |
---|---|
vCPU | US$0.03908 / 1 hour |
RAM | US$0.00524 / 1 gibibyte hour |
A2 系列
计费项 | 价格 (USD) |
---|---|
vCPU | US$0.0363527 / 1 hour |
RAM | US$0.0048725 / 1 gibibyte hour |
GPU (A100 40 GB) | US$3.3741 / 1 hour |
GPU (A100 80 GB) | US$4.51729 / 1 hour |
A3 系列
计费项 | 价格 (USD) |
---|---|
vCPU | US$0.0293227 / 1 hour |
RAM | US$0.0025534 / 1 gibibyte hour |
GPU (H100 80 GB) | US$11.2660332 / 1 hour |
GPU (H200) | US$10.708501 / 1 hour |
G2 系列
计费项 | 价格 (USD) |
---|---|
vCPU | US$0.02874 / 1 hour |
RAM | US$0.00337 / 1 gibibyte hour |
GPU (L4) | US$0.64405 / 1 hour |
某些机器类型允许添加可选的 GPU 加速器用于预测。除上表所列费用外,可选 GPU 会产生一笔额外的费用。可查看以下各价格表,了解各种可选 GPU 的价格。
加速器 - 每小时价格
GPU 类型 | 价格 (USD) |
---|---|
NVIDIA_TESLA_P4 | US$0.69 / 1 hour |
NVIDIA_TESLA_P100 | US$1.679 / 1 hour |
NVIDIA_TESLA_T4 | US$0.402 / 1 hour |
NVIDIA_TESLA_V100 | US$2.852 / 1 hour |
价格按 GPU 计算。如果您的每个预测节点使用多个 GPU(或者您的版本在扩容后使用多个节点),那么费用会按比例增加。
AI Platform Prediction 通过运行多个虚拟机(“节点”)来使用模型进行预测。默认情况下,Vertex AI 会随时自动扩缩运行的节点数。对于在线预测,系统会根据需求量来扩缩节点数。每个节点可响应多个预测请求。对于批量预测,AI Platform Prediction 会适当扩缩节点数以减少运行作业所需的总时间。您可以自定义预测节点的扩缩方式。
您需要为模型所用的每个节点的运行时间支付费用,包括:
一个节点运行一小时即为一个“节点时”。预测价格表列出了节点时的价格。各个区域的价格各不相同,在线预测和批量预测的价格也有差异。
节点时可按小数计费。例如,一个节点运行 30 分钟计为 0.5 节点时。
Compute Engine (N1) 机器类型的费用计算
详细了解预测节点的自动扩缩
在线预测 | 批量预测 |
---|---|
扩缩的优先目标是缩短各个请求的延迟时间。处理完一个请求后,服务会让您的模型在几分钟的空闲时间里保持就绪状态。 | 容量扩缩的优先目标是减少作业的总时间。 |
扩缩会影响您每个月的总费用:请求数越多,请求越频繁,使用的节点就越多。 | 扩缩对作业价格的影响微乎其微,但启用新节点需要一定的开销。 |
您可以选择让服务根据流量多少来扩缩(自动扩缩),也可以指定不间断运行的节点数量以避免延迟(手动扩缩)。
| 您可为批量预测作业设置所用节点数量上限并在部署模型时设置要保持运行的节点数,以此影响扩缩方式。 |
批量预测作业在作业完成后计费
批量预测作业在作业完成后计费,而不是在作业期间递增费用。作业运行时不会触发您已配置的任何 Cloud Billing 预算提醒。在启动大型作业之前,请考虑先使用较小的输入数据集运行一些作业,确立费用基准。
预测计算示例
美洲区域一家房地产公司每周都会对他们营业地区的房屋价值进行预测。在一个月的四周内,他们分别运行了包含 3920、4277、3849 和 3961 项预测的四项作业。作业仅使用一个节点,每项预测平均需要 0.72 秒的处理时间。
首先计算每项作业运行的时长:
每项作业都运行超过十分钟,因此按处理分钟数计费:
当月的总费用为 $0.26。
此示例假定作业在单个节点上运行,并且每项预测花费的时间都一致。在实际使用中,请务必在计算时考虑使用的节点数量和每个节点的实际运行时间。
Vertex Explainable AI 费用
基于特征的解释
基于特征的解释不会在预测价格的基础上产生额外费用。但解释要比正常的预测花费更长的时间,因此大量使用 Vertex Explainable AI 以及自动扩缩可能导致启动更多节点,这将增加预测费用。
基于样本的解释
基于样本的解释的收费包含以下部分:
下面的表格汇总了 Neural Architecture Search 在每个提供该服务的区域的价格。
价格
下面的表格提供了各种配置的“每小时价格”。
您可以选择预定义的容量层级,也可以选择由所选机器类型组成的自定义配置。如果选择自定义配置,请将您使用的虚拟机的费用相加。
支持加速器的旧版机器类型的价格包含了加速器的费用。如果您使用 Compute Engine 机器类型并挂接加速器,则加速器的费用需另外计算。如需计算此费用,请将下表中加速器的价格乘以您使用的每种加速器类型的数量。
机器类型
机器类型 | 价格 (USD) |
---|---|
n1-standard-4 | US$0.2849985 / 1 hour |
n1-standard-8 | US$0.569997 / 1 hour |
n1-standard-16 | US$1.139994 / 1 hour |
n1-standard-32 | US$2.279988 / 1 hour |
n1-standard-64 | US$4.559976 / 1 hour |
n1-standard-96 | US$6.839964 / 1 hour |
n1-highmem-2 | US$0.1774545 / 1 hour |
n1-highmem-4 | US$0.1774545 / 1 hour |
n1-highmem-8 | US$0.709818 / 1 hour |
n1-highmem-16 | US$1.419636 / 1 hour |
n1-highmem-32 | US$2.839272 / 1 hour |
n1-highmem-64 | US$5.678544 / 1 hour |
n1-highmem-96 | US$8.517816 / 1 hour |
n1-highcpu-16 | US$0.8501832 / 1 hour |
n1-highcpu-32 | US$1.7003664 / 1 hour |
n1-highcpu-64 | US$3.4007328 / 1 hour |
n1-highcpu-96 | US$5.1010992 / 1 hour |
a2-highgpu-1g | US$5.641070651 / 1 hour |
a2-highgpu-2g | US$11.282141301 / 1 hour |
a2-highgpu-4g | US$22.564282603 / 1 hour |
a2-highgpu-8g | US$45.128565205 / 1 hour |
a2-highgpu-16g | US$90.257130411 / 1 hour |
e2-standard-4 | US$0.20103426 / 1 hour |
e2-standard-8 | US$0.40206852 / 1 hour |
e2-standard-16 | US$0.80413704 / 1 hour |
e2-standard-32 | US$1.60827408 / 1 hour |
e2-highmem-2 | US$0.13559949 / 1 hour |
e2-highmem-4 | US$0.27119898 / 1 hour |
e2-highmem-8 | US$0.54239796 / 1 hour |
e2-highmem-16 | US$1.08479592 / 1 hour |
e2-highcpu-16 | US$0.59364288 / 1 hour |
e2-highcpu-32 | US$1.18728576 / 1 hour |
n2-standard-4 | US$0.291354 / 1 hour |
n2-standard-8 | US$0.582708 / 1 hour |
n2-standard-16 | US$1.165416 / 1 hour |
n2-standard-32 | US$2.330832 / 1 hour |
n2-standard-48 | US$3.496248 / 1 hour |
n2-standard-64 | US$4.661664 / 1 hour |
n2-standard-80 | US$5.82708 / 1 hour |
n2-highmem-2 | US$0.196521 / 1 hour |
n2-highmem-4 | US$0.393042 / 1 hour |
n2-highmem-8 | US$0.786084 / 1 hour |
n2-highmem-16 | US$1.572168 / 1 hour |
n2-highmem-32 | US$3.144336 / 1 hour |
n2-highmem-48 | US$4.716504 / 1 hour |
n2-highmem-64 | US$6.288672 / 1 hour |
n2-highmem-80 | US$7.86084 / 1 hour |
n2-highcpu-16 | US$0.860352 / 1 hour |
n2-highcpu-32 | US$1.720704 / 1 hour |
n2-highcpu-64 | US$3.441408 / 1 hour |
n2-highcpu-80 | US$4.30176 / 1 hour |
c2-standard-4 | US$0.313212 / 1 hour |
c2-standard-8 | US$0.626424 / 1 hour |
c2-standard-16 | US$1.252848 / 1 hour |
c2-standard-30 | US$2.34909 / 1 hour |
c2-standard-60 | US$4.69818 / 1 hour |
如果您使用非美元货币付费,请参阅 Cloud Platform SKU 上以您的币种列出的价格。
a2-highgpu 实例的价格包含挂接 NVIDIA_TESLA_A100 加速器的价格。
加速器
GPU 类型 | 价格 (USD) |
---|---|
NVIDIA_TESLA_A100 | US$4.400862 / 1 hour |
NVIDIA_TESLA_P4 | US$0.90 / 1 hour |
NVIDIA_TESLA_P100 | US$2.19 / 1 hour |
NVIDIA_TESLA_T4 | US$0.525 / 1 hour |
NVIDIA_TESLA_V100 | US$3.72 / 1 hour |
如果您使用非美元货币付费,请参阅 Cloud Platform SKU 上以您的币种列出的价格。
磁盘
磁盘类型 | 价格 (USD) |
---|---|
pd-standard | US$0.000082192 / 1 gibibyte hour |
pd-ssd | US$0.000349315 / 1 gibibyte hour |
如果您使用非美元货币付费,请参阅 Cloud Platform SKU 上以您的币种列出的价格。
注意:
必须使用 Cloud Storage
除了本文档中列出的费用以外,在 Neural Architecture Search 生命周期中,您必须将数据和程序文件存储在 Cloud Storage 存储分区中。此类存储需遵循 Cloud Storage 价格政策。
以下各项必须使用 Cloud Storage:
注意:您可以使用 BigQuery 等其他 Google Cloud 服务来存储输入数据,并按相应的价格付费。
用于管理资源的免费操作
Neural Architecture Search 提供的资源管理操作是免费的。Neural Architecture Search 配额政策对其中一些操作设有限制。
资源 | 免费操作 |
---|---|
作业 | get、list、cancel |
操作 | get、list、cancel、delete |
Vertex AI Pipelines 的每次流水线运行费用为 $0.03。在预览版期间,您无需支付执行费用。您还需要为与 Vertex AI Pipelines 一起使用的 Google Cloud 资源付费,例如流水线组件消耗的 Compute Engine 资源(按与 Vertex AI 训练相同的费率计费)。最后,您要负责流水线调用的任何服务(例如 Dataflow)的费用。
Vertex AI Feature Store 正式版 (GA) 自 2023 年 11 月推出。如需了解该产品的过往版本,请前往 Vertex AI Feature Store(旧版)。
全新 Vertex AI Feature Store
全新的 Vertex AI Feature Store 支持两类操作功能:
离线操作费用
由于离线操作使用 BigQuery,请参阅 BigQuery 费用,了解有关注入离线存储区、查询离线存储区和离线存储等功能。
在线操作费用
就在线操作而言,Vertex AI Feature Store 会对将数据传输至在线存储区、传送数据或存储数据的所有正式版功能收费。“节点时”表示虚拟机完成一项操作花费的时间,按分钟计费。
操作 | 价格 (USD) |
---|---|
数据处理节点 数据处理(例如,将数据注入到任何在线 存储、监控等) | US$0.08 / 1 hour |
经过优化的在线传送节点 低延迟服务和嵌入服务 每个节点包含 200GB 存储空间 | US$0.30 / 1 hour |
Bigtable 在线传送节点 使用 Cloud Bigtable 提供服务 | US$0.94 / 1 hour |
Bigtable 在线传送存储 使用 Cloud Bigtable 提供服务的存储空间 | US$0.000342466 / 1 gibibyte hour |
经过优化的在线传送与 Bigtable 在线传送使用的架构并不相同,因此两者的节点不具有可比性。
如果您使用非美元货币付费,请参阅 Cloud Platform SKU 上以您的币种列出的价格。
在线操作工作负载估算
在估算工作负载时请考虑以下准则。对于特定工作负载,不同的传送方式需要的节点数可能不同。
您可以在 Metrics Explorer 中查看节点(含副本)的数量:
月度场景示例(假设使用 us-central1)
数据流工作负载 - Bigtable 在线传送 2.5 TB 数据(每日更新 1 GB)和 1200 QPS
运维 | 每月用量 | 每月费用 |
---|---|---|
数据处理节点 | (1 GB/天) * (30 天/月) * (1,000 MB/GB) * (1 节点时 / 100 MB) = 300 节点时 | 300 节点时 * ($0.08/节点时) = $24 |
经过优化的在线传送节点 | 不适用 | 不适用 |
Bigtable 在线传送节点 | (1 个节点) * (24 小时/天) * (30 天/月) = 720 节点时 | 720 节点时 * ($0.94/节点时) = $677 |
Bigtable 在线传送存储 | (2.5 TB-月) * (1000 GB/TB) = 2500 GB-月 | 2500 GB-月 * ($0.25/ GB-月) = $625 |
总计 | $1,326 |
高 QPS 工作负载 - 优化后的在线传送,包含 10GB 非嵌入数据(每日更新 5GB)和 2000QPS
运维 | 每月用量 | 每月费用 |
---|---|---|
数据处理节点 | (5 GB/天) * (30 天/月) * (1,000 MB/GB) * (1 节点时 / 100MB) = 1500 节点时 | 1500 节点时 * ($0.08/节点时) = $120 |
经过优化的在线传送节点 | Roundup(10GB * (1 个节点 / 200 GB)) = 1 * max(2 个默认副本, 2000 QPS * (1 个副本 / 500 QPS)) = 4 个总节点 * (24 小时/天) * (30 天/月) =2880 节点时 | 2880 节点时 * (0.30/节点时) = $864 |
Bigtable 在线传送节点 | 不适用 | 不适用 |
Bigtable 在线传送存储 | 不适用 | 不适用 |
总计 | $984 |
嵌入传送工作负载 - 优化后的在线传送,包含 20GB 的嵌入数据(每日更新 2GB)和 800QPS
运维 | 每月用量 | 每月费用 |
---|---|---|
数据处理节点 | (2 GB/天) * (30 天/月) * (1,000 MB/GB) * (1 节点时 / 100MB) = 600 节点时 | 600 节点时 * ($0.08/节点时) = $48 |
经过优化的在线传送节点 | Roundup(20GB* (1 个节点 / 4GB) = 5 * max(2 个默认副本, 800 QPS * (1 个副本 / 500 QPS)) = 10 个总节点 * (24 小时/天) * (30 天/月) = 7200 节点时 | 7200 节点时 * (0.30/节点时) = $2160 |
Bigtable 在线传送节点 | 不适用 | 不适用 |
Bigtable 在线传送存储 | 不适用 | 不适用 |
总计 | $2,208 |
Vertex AI Feature Store(旧版)
Vertex AI Feature Store(旧版)的价格取决于在线和离线存储中的特征数据量以及在线传送的可用性。“每节点时”表示虚拟机花费在传送特征数据上或处于就绪状态以等待处理特征数据请求的时间。
操作 | 价格 (USD) |
---|---|
在线存储天数 | 每月每 GB $0.25 |
离线存储天数 | 每月每 GB $0.023 |
在线传送 | 每个节点每小时 $0.94 |
批量导出 | 每 GB $0.005 |
流式注入 | 每 GB 注入费用 $0.10 |
如果您使用非美元货币付费,请参阅 Cloud Platform SKU 上以您的币种列出的价格。
启用特征值监控功能后,计费范围不仅包含上述适用费用,还包含以下适用费用:
快照分析示例
一位数据科学家在 Vertex AI Feature Store(旧版)中启用了特征值监控功能,并开启了每日快照分析监控。系统每天为监控的实体类型运行一条流水线。该流水线扫描了 Vertex AI Feature Store(旧版)中的 2GB 数据,并导出含 0.1GB 数据的快照。一天的分析总费用为:
(0.1 GB * $3.50) + (2 GB * $0.005) = $0.36
注入分析示例
一位数据科学家在 Vertex AI Feature Store(旧版)中启用了特征值监控功能,并开启了注入操作监控。注入操作将 1GB 数据导入到 Vertex AI Feature Store(旧版)。特征值监控的总费用为:
(1 GB * $3.50) = $3.50
元数据存储量是以二进制千兆字节 (GiB) 为单位计量的,其中 1 GiB 为 1,073,741,824 个字节。这种计量单位也称为吉比字节。
Vertex ML Metadata 按照每月每吉比字节 (GiB) $10 收取元数据存储的费用。按每兆字节 (MB) 的比例计费。例如,如果您存储了 10 MB 的元数据,则每月需为这 10 MB 元数据支付 $0.10。
注意:在所有支持 Vertex ML Metadata 的区域,价格都相同。
如需使用 Vertex AI TensorBoard,请向项目的 IAM 管理员申请为您分配“Vertex AI TensorBoard Web App User”角色。Vertex AI Administrator 角色也有访问权限。
从 2023 年 8 月开始,Vertex AI TensorBoard 的收费发生了变化,从每月向每位用户收取 $300 的许可费变更为按每月每 GiB $10 收取日志和指标的数据存储费用。这意味着不会再产生任何订阅费用。您只需为已使用的存储空间付费。如需了解如何管理存储空间,请参阅 Vertex AI TensorBoard:删除过时的 TensorBoard 实验 教程。
Vertex AI Vizier 是 Vertex AI 内的一项黑盒优化服务。Vertex AI Vizier 价格模型由以下几个部分组成:
Vector Search Approximate Nearest Neighbor 服务的价格包含:
在构建和更新索引期间处理的数据是以二进制千兆字节 (GiB) 为单位计量的,其中 1 GiB 为 1,073,741,824 个字节。这种计量单位也称为吉比字节。
Vector Search 对所有区域中处理的每吉比字节 (GiB) 数据收取 $3.00。Vector Search 对流式更新插入收取 $0.45/GiB 的注入费用。
下面的表格汇总了 Vector Search 在每个提供该服务的区域的索引服务价格。价格按照机器类型、区域和每节点时的费用计算。
机器类型 | 价格 (USD) |
---|---|
e2-standard-2 | US$0.0938084 / 1 hour |
e2-standard-16 | US$0.7504672 / 1 hour |
e2-highmem-16 | US$1.012368 / 1 hour |
n2d-standard-32 | US$1.8926208 / 1 hour |
n1-standard-16 | US$1.0639944 / 1 hour |
n1-standard-32 | US$2.1279888 / 1 hour |
Vector Search 价格示例
Vector Search 的价格取决于数据大小、您想要运行的每秒查询次数 (QPS) 和使用的节点数。要预估服务成本,需要计算数据的总大小。数据大小为嵌入/矢量数量* 维度数量* 每维度 4 字节。确定数据大小后,即可计算传送费用和构建费用。传送费用加构建费用等于每月总费用。
流式更新:Vector Search 使用基于启发法的指标来确定何时触发压缩。如果最早的未压缩数据存在时间超过 5 天,则始终会触发压缩。除了流式更新费用外,您还需要按与批量更新相同的费率支付重建索引的费用。
嵌入/矢量数量 | 维度数量 | 每秒查询数 (QPS) | 机器类型 | 节点 | 估算的每月传送费用(美元) |
---|---|---|---|---|---|
200 万 | 128 | 100 | e2-standard-2 | 1 | $68 |
2000 万 | 256 | 1000 | e2-standard-16 | 1 | $547 |
2000 万 | 256 | 3000 | e2-standard-16 | 3 | $1,642 |
1 亿 | 256 | 500 | e2-highmem-16 | 2 | $1,477 |
10 亿 | 100 | 500 | e2-highmem-16 | 8 | $5,910 |
所有示例均基于 us-central1 中的机器类型。产生的费用因召回率和延迟要求而异。预计的每月传送成本与控制台中使用的节点数直接相关。如需详细了解影响费用的配置参数,请参阅影响召回和延迟的配置参数。
如果每秒查询次数 (QPS) 较高,则对这些查询进行批处理可将总费用降低 30%-40%。
Vertex AI Model Registry 是一个中央存储库,可以跟踪和列示您的模型版本。将模型导入 Vertex AI 后,这些模型就会出现在 Vertex AI Model Registry 中。将您的模型导入 Model Registry 不会产生任何费用。只有将模型部署至端点或使用模型进行批量预测时,才会产生费用。该费用取决于部署的模型类型。
如需详细了解从 Vertex AI Model Registry 部署自定义模型的价格,请参阅自定义训练模型。如需详细了解部署 AutoML 模型的价格,请参阅 AutoML 模型的价格。
Vertex AI 使您能够在将模型部署到生产环境后监控模型的持续有效性。如需了解详情,请参阅 Vertex AI Model Monitoring 简介。
使用 Vertex AI Model Monitoring 时,您需要支付以下费用:
Vertex AI Model Monitoring 支持以下区域:us-central1、europe-west4、asia-east1 和 asia-southeast1。所有区域的价格都相同。
数据大小在转换为 TfRecord 格式后进行测量。
设置 Vertex AI Model Monitoring 作业时,训练数据集会产生一次性费用。
预测数据集由从在线预测服务收集的日志组成。当预测请求在不同的时间窗口到达时,每个时间窗口的数据会被收集,为每个预测窗口分析的数据的总和会用于计算费用。
示例:数据科学家对其模型的预测流量进行模型监控。
请选择实例、托管式笔记本或用户管理的笔记本以了解价格信息。
实例
下表提供了各种虚拟机配置的大致每小时价格。您可以选择采用由所选机器类型组成的自定义配置。如需计算价格,请将您使用的虚拟机的费用相加。
如果您使用 Compute Engine 机器类型并挂接加速器,则加速器的费用需另外计算。如需计算此费用,请将下表中加速器的价格乘以您使用的每种加速器类型的机器小时数。
CPU
机器类型 | 每个 vCPU 的价格(美元) |
---|---|
N1 | US$0.0379332 / 1 hour |
N2 | US$0.0379332 / 1 hour |
E2 | US$0.026173908 / 1 hour |
A2 | US$0.0379332 / 1 hour |
内存
机器类型 | 价格 (USD) |
---|---|
N1 | US$0.0050844 / 1 gibibyte hour |
N2 | US$0.0050844 / 1 gibibyte hour |
E2 | US$0.003508236 / 1 gibibyte hour |
A2 | US$0.0050844 / 1 gibibyte hour |
加速器
机器类型 | 价格 (USD) |
---|---|
Nvidia Tesla A100 | US$4.400862 / 1 hour |
Nvidia Tesla A100 80GB | US$4.51729 / 1 hour |
Nvidia Tesla T4 | US$0.525 / 1 hour |
Nvidia Tesla V100 | US$3.72 / 1 hour |
Nvidia Tesla P100 | US$2.19 / 1 hour |
磁盘
机器类型 | 价格 (USD) |
---|---|
Hyperdisk Extreme 预配空间 | US$0.000205479 / 1 gibibyte hour |
平衡预配空间 | US$0.000164384 / 1 gibibyte hour |
极端预配空间 | US$0.000205479 / 1 gibibyte hour |
SSD 预配空间 | US$0.000279452 / 1 gibibyte hour |
标准预配空间 | US$0.000065753 / 1 gibibyte hour |
您的 Vertex AI Workbench 实例会产生以下费用:
代管式笔记本
价格由以下费用组成:您使用的计算和存储资源、Vertex AI Workbench 实例的管理费,以及您使用的所有其他云资源。如需了解详情,请参阅以下部分。
计算和存储资源
计算和存储资源的费用与您当前支付的 Compute Engine 和 Cloud Storage 费率相同。
管理费
除了基础设施使用费之外,还需支付 Vertex AI Workbench 管理费,详情见以下表格。
SKU | 价格 (USD) |
---|---|
vCPU | 每个 vCPU $0.05 |
T4 和 P4(标准 GPU) | 每个 GPU $0.35 |
P100、V100、L4 和 A100 GPU(高级 GPU) | 每个 GPU $2.48 |
用户管理的笔记本
价格由以下费用组成:您使用的计算和存储资源、Vertex AI Workbench 实例的管理费,以及您使用的所有其他云资源。如需了解详情,请参阅以下部分。
计算和存储资源
计算和存储资源的费用与您当前支付的 Compute Engine 和 Cloud Storage 费率相同。
管理费
除了基础设施使用费之外,还需支付 Vertex AI Workbench 管理费,详情见以下表格。
SKU | 价格 (USD) |
---|---|
vCPU | 每个 vCPU $0.005 |
T4 和 P4(标准 GPU) | 每个 GPU $0.035 |
P100、V100 和 A100 GPU(高级 GPU) | 每个 GPU $0.25 |
其他 Google Cloud 资源
除了此前提及的费用,您使用的所有 Google Cloud 资源也需付费。例如:
如需了解 Colab Enterprise 价格信息,请参阅 Colab Enterprise 价格。
对于 Deep Learning Containers、Deep Learning VM Image 和 AI Platform Pipelines,根据您使用的计算和存储资源来计算价格。这些资源的费用与您当前支付的 Compute Engine 和 Cloud Storage 费率相同。
除了计算和存储费用之外,您使用的所有 Google Cloud 资源也需付费。例如:
使用 Vertex AI 时,您可以申请以人工方式为计划用于训练自定义机器学习模型的数据集加标签。该服务的价格根据标签任务的类型计算。
下表根据为每种目标列出的单元,提供了每位人工标签添加者每添加 1,000 个单元的注释的价格。每个 Google Cloud 项目中每月前 5 万个单元按层级 1 的价格付费;接下来的 95 万个单元按层级 2 的价格付费,直至满 100 万个单元。如需了解每月超过 100 万个单元时的价格,请与我们联系。
数据类型 | 目标 | 单位 | 第 1 层价格 (USD) | 层级 2 价格 (USD) |
---|---|---|---|---|
映像 | 分类 | 映像 | $35 | $25 |
边界框 | 边界框 | $63 | $49 | |
分割 | 片段 | $870 | $850 | |
旋转框 | 边界框 | $86 | $60 | |
多边形/多段线 | 多边形/多段线 | $257 | $180 | |
视频 | 分类 | 5 秒视频 | $86 | $60 |
对象跟踪 | 边界框 | $86 | $60 | |
动作识别 | 30 秒视频中的事件 | $214 | $150 | |
文本 | 分类 | 50 个字词 | $129 | $90 |
情感 | 50 个字词 | $200 | $140 | |
实体提取 | 实体 | $86 | $60 | |
主动学习 | 全部 | 数据项 | $80 | $56 |
自定义标签添加者 | 全部 | 数据项 | $80 | $56 |
除了本文档中列出的费用以外,您还需要在 Vertex AI 生命周期内将数据和程序文件存储在 Cloud Storage 存储分区中。此类存储需遵循 Cloud Storage 价格政策。
以下各项必须使用 Cloud Storage:
AI Platform 提供的资源管理操作是免费的。AI Platform 配额政策对其中一些操作设有限制。
资源 | 免费操作 |
---|---|
models | create、get、list、delete |
版本 | create、get、list、delete、setDefault |
作业 | get、list、cancel |
操作 | get、list、cancel、delete |
如果您将要分析的图片存储在 Cloud Storage 中,或者在使用 Vertex AI 的同时使用其他 Google Cloud 资源,则您还需要支付使用这些服务所产生的费用。
如需在 Google Cloud 控制台中查看当前结算状态(包括使用情况和当前账单),请参阅“结算”页面。如需详细了解如何管理您的账号,请参阅 Cloud Billing 文档 或 结算和付款支持。