Vertex AI 价格

所列价格以美元 (USD) 为单位。 如果您使用非美元货币付费,请参阅 Cloud Platform SKU 上以您的币种列出的价格。

本页面介绍了 Vertex AI 上的生成式 AI 的价格。如需了解所有其他 Vertex AI 价格(包括机器学习平台和 MLOps 服务),请参阅 Vertex AI 价格页面

Google 模型

Gemini

借助 Vertex AI 中的多模态模型,您可以输入文本或媒体(图片、视频)。文本输入按每 1,000 个字符的输入(提示)和每 1,000 个字符的输出(回复)计费。字符按 UTF-8 码位计数,计数中不包括空格,每个词元大约有 4 个字符。生成过滤后响应的预测请求仅针对输入计费。在每个结算周期结束时,1 美分的小数部分 ($0.01) 会四舍五入到 1 美分。媒体输入按图片数量或秒数(视频)收费。

型号 功能 类型 价格
(< 128K 输入词元)
价格
(超过 128K 输入词元)
Gemini 1.5 Flash 多模态 图片输入
视频输入
文本输入
音频输入
$0.00002 / 图片
$0.00002 / 秒
$0.00001875 / 1,000 个字符
$0.000002 / 秒
$0.00004 / 图片
$0.00004 / 秒
$0.0000375 / 1000 个字符
$0.000004 / 秒
文本输出 $0.000075 / 1,000 个字符 $0.00015 / 1,000 个字符
调优* 培训令牌 8 美元 / 百万词元
Gemini 1.5 Pro 多模态 图片输入
视频输入
文本输入
音频输入
$0.00032875 / 图片
$0.00032875 / 秒
$0.0003125 / 1,000 个字符
$0.00003125 / 秒
$0.0006575 / 图片
$0.0006575 / 秒
$0.000625 / 1,000 个字符
$0.0000625 / 秒
文本输出 $0.00125 / 1,000 个字符 $0.0025 / 1,000 个字符
调优* 培训令牌 80 美元 / 百万词元
Gemini 1.0 Pro 多模态 图片输入
视频输入
文本输入
$0.0025/图片
$0.002/秒
$0.000125/1000 个字符
文本输出 $0.000375/1000 个字符
使用 Google 搜索建立依据 文本 以事实为依据的请求 每 1,000 次请求 35 美元(每天最多 100 万次请求)。
如果您需要每天超过 100 万次请求,请与您的客户支持团队联系。

* 所列价格以美元 (USD) 为单位。 如果您使用非美元货币付费,请参阅 Cloud Platform SKU 上以您的币种列出的价格。
* 如果查询上下文长度超过 12.8 万,则所有 token 都按长上下文费率收费。
* 批量模式下,Gemini 模型可享受 50% 的折扣。
* Gemini 1.0 Pro 仅支持最多 32K 的上下文窗口。
* PDF 按图片输入收费,1 个 PDF 页面等同于 1 张图片。
* 调优后的模型端点的预测价格与基础模型相同。
* 使用 Google 搜索进行基准化:如果您使用动态检索来优化费用,只有在响应中包含至少一个来自 Google 搜索的基准化支持网址的请求才会产生 Grounding with Google Search 费用。您始终需要支付 Gemini 费用。

Imagen

借助 Vertex AI 上的 Imagen,您可以根据您提供的文本提示生成新图片并修改图片,或使用您定义的遮盖区域以及许多其他功能仅修改图片的某些部分。

模型 功能 说明 输入 输出 价格
Imagen 3 图片生成 生成图片 文本提示 Image 每张图片 $0.04
Imagen 3 Fast 图片生成 生成图片 文本提示 Image 每张图片 $0.02
Imagen 2、Imagen 图片生成 生成图片 文本提示 映像 每个图片 $0.020
图片修改 使用无蒙版或蒙版方法修改图片 图片/文字提示 映像 每个图片 $0.020
提升 将生成的图片的分辨率提高到 2K 和 4K 映像 映像 每个映像 $0.003
微调 启用用户提供的“主题”以用于 Imagen 提示(少样本训练) 带有文本标识符的主题,每个主题 4-8 张图片 微调后的模型(使用用户提供的主题进行训练后) 每节点时 $(Vertex AI 自定义训练价格)
视觉标注 为图片生成短文本或长文本字幕 映像 文本字幕 $0.0015/图片
视觉问答 根据引用图片的问题提供回答 图片/文字提示 文本回答 $0.0015/图片

所列价格以美元 (USD) 为单位。 如果您使用非美元货币付费,请参阅 Cloud Platform SKU 上以您的币种列出的价格。

嵌入

模型 功能 说明 输入 输出 价格
多模态嵌入 Embeddings for Multimodal:文本 使用文本作为输入来生成嵌入 文本 Embeddings $0.0002/1,000 个字符输入
Embeddings for Multimodal:图片 使用图片作为输入来生成嵌入 映像 Embeddings $0.0001/图片输入
Embeddings for Multimodal:视频加 Video Plus 视频 嵌入(每分钟视频最多 15 项嵌入) 每秒视频 $0.0020
Embeddings for Multimodal:视频标准 Video Standard 视频 嵌入(每分钟视频最多 8 项嵌入) 每秒视频 $0.0010
Embeddings for Multimodal:视频基本信息 Video Essential 视频 嵌入(每分钟视频最多 4 项嵌入) 每秒视频 $0.0005
模型 类型 区域 每 1,000 个字符的价格
Embeddings for Text 输入 Global
  • 在线请求:$0.000025
  • 批量请求:$0.00002
输出 Global
  • 在线请求:免费
  • 批量请求:免费

所列价格以美元 (USD) 为单位。 如果您使用非美元货币付费,请参阅 Cloud Platform SKU 上以您的币种列出的价格。

代码补全

Vertex AI 上的生成式 AI 按每 1,000 个字符的输入(提示)和每 1,000 个字符的输出(回复)计费。字符按 UTF-8 码位计数,计数中不包括空格。在预览版阶段,费用享受 100% 的折扣。生成过滤后响应的预测请求仅针对输入计费。在每个结算周期结束时,1 美分的小数部分 ($0.01) 会四舍五入到 1 美分。

模型 类型 区域 每 1,000 个字符的价格
Codey for Code Completion 输入 全球
  • 在线请求:$0.00025
输出 全球
  • 在线请求:$0.0005

所列价格以美元 (USD) 为单位。 如果您使用非美元货币付费,请参阅 Cloud Platform SKU 上以您的币种列出的价格。

翻译(文本)

使用 Vertex AI API 和翻译 LLM 来翻译文本。与传统翻译模型相比,LLM 翻译的语言通常更流畅、更贴近人类语言,但支持的语言较少(了解详情)

型号 方法 用量 每百万字符的价格
LLM 文字翻译预览版* 每月输入字符数

每 1000 万个字符 $10*

每月输出字符数

每 1000 万个字符 $10*

所列价格以美元 (USD) 为单位。 如果您使用非美元货币付费,请参阅 Cloud Platform SKU 上以您的币种列出的价格。
* 价格按模型处理的字符数计算。如需详细了解会对哪些字符计费,请参阅计费字符

上下文缓存

通过上下文缓存,你可以将 Gemini 输入词元处理费用降低 75%,并将内容生成延迟时间缩短到 100 毫秒。数据在缓存中存储的时间长度(可由用户控制)决定了“Context Cache Storage”的费用。在创建缓存的上下文时,用户将被收取标准输入代币费用。输入数据的缓存命中将按较低的费率(“缓存输入”)收费,而不是按正常的输入费用收费。存储和输入的数据大小采用与 Gemini 输入价格相同的计算方式。

模型 功能 类型 价格(= 128K 输入令牌) 价格(超过 128K 输入词元)
Gemini 1.5 Flash 缓存的输入 图片输入
视频输入
文本输入
音频输入
0.000005 美元 / 图片
0.000005 美元 / 秒
0.0000046875 美元 / 1,000 个字符
0.0000005 美元 / 秒
0.00001 美元 / 图片
0.00001 美元 / 秒
0.000009375 美元 / 1,000 个字符
0.000001 美元 / 秒
上下文缓存空间 图片输入
视频输入
文本输入
音频输入
0.000263 美元 / 小时 / 图片
0.000263 美元/ 小时 / 秒
0.00025 美元 / 小时 / 1,000 个字符
0.000025 美元 / 小时 / 秒
Gemini 1.5 Pro 缓存的输入 图片输入
视频输入
文本输入
音频输入
0.0000821875 美元 / 图片
0.0000821875 美元 / 秒
0.000078125 美元 / 1,000 个字符
0.0000078125 美元 / 秒
0.000164375 美元 / 图片
0.000164375 美元 / 秒
0.00015625 美元 / 1,000 个字符
0.000015625 美元 / 秒
上下文缓存空间 图片输入
视频输入
文本输入
音频输入
0.0011835 / 图片 / 小时
0.0011835/ 秒 / 小时
0.001125 / 1,000 个字符 / 小时
0.0001125 / 秒 / 小时

所列价格以美元 (USD) 为单位。 如果您使用非美元货币付费,请参阅 Cloud Platform SKU 上以您的币种列出的价格。

缓存费用计算示例

如果用户创建一个 250,000 个字符的缓存上下文,并且该上下文的 TTL 为 2 小时,随后在 2 小时内向 Gemini 1.5 Pro 模型发送 20 个单独的请求,并且每个请求都包含添加到缓存上下文的 200 个字符的查询和 400 个字符的输出,则总费用的计算方式如下:

Cache Creation cost:
250,000 input characters x ($0.0003125 / 1000) = $0.078125 cached input cost.

Cache Storage cost:
250,000 characters x 2 hours = 500,000 total character hours;
500,000 total character hours x ($0.001125 / 1000) = $0.5625 storage cost.

Requests using cache cost:
200 characters x 20 requests = 4,000 total character inputs
250,000 cached characters * 20 requests = 5,000,000 total cached character inputs
4,000 total character inputs * ($0.0003125 / 1000) = $0.00125 character input cost
5,000,000 total cached character inputs * ($0.000078125 / 1000) = $0.390625 cached input cost
$0.00125 character input cost + $0.390625 cached input cost = $0.391875 total input cost

Output cost:
400 output characters x 20 prompts = 8,000 total output characters;
8,000 total output characters x ($0.00375 / 1000) = $0.03 output cost.

Total cost:
$0.078125 cached input cost + $0.5625 cached storage cost + $0.391875 input cost + $0.03 output cost = $1.0625 total cost.

费用计算示例

如果用户向 PaLM Text Bison 模型发送五个单独的请求,并且每个请求包含 200 个字符的输入和 400 个字符的输出,则总费用的计算方式如下:

Input cost:
200 input characters x 5 prompts = 1,000 total input characters;
1,000 total input characters x ($0.00025 / 1000) = $0.00025 input cost.

Output cost:
400 output characters x 5 prompts = 2,000 total output characters;
2,000 total output characters x ($0.0005 / 1000) = $0.001 output cost.

Total cost:
$0.00025 input cost + $0.001 output cost = $0.00125 total cost.

合作伙伴模型

合作伙伴模型是由 Google 合作伙伴开发的一系列精选生成式 AI 模型。合作伙伴模型以托管式 API 的形式提供。如需了解详情,请参阅合作伙伴模型概览。 以下部分列出了 Google 合作伙伴模型的价格详情。

AI21 Lab 的模型

型号 价格
Jamba 1.5 Large 输入:$2 / 100 万个词元
输出:$8 / 100 万个词元
Jamba 1.5 Mini 输入:$0.20 / 百万个代币
输出:$0.40 / 百万个代币

Anthropic 的 Claude 模型

型号 价格
Claude 3.5 Haiku 输入:$1.00 / 百万个词元
输出:$5.00 / 百万个词元
Claude 3.5 Sonnet v2 输入:$3 / 百万个词元
输出:$15 / 百万个词元
Claude 3.5 Sonnet 输入:$3 / 百万个词元
输出:$15 / 百万个词元
Claude 3 Haiku 输入:$0.25 / 百万个令牌
输出:$1.25 / 百万个令牌
Claude 3 Sonnet 输入:$3 / 百万个词元
输出:$15 / 百万个词元
Claude 3 Opus 输入:$15 / 百万个词元
输出:$75 / 百万个词元

Meta 的 Llama 模型

型号 价格
Llama 3.1 405B 输入:$5.00 / 百万个词元
输出:$16.00 / 百万个词元

Mistral AI 的模型

型号 价格
Mistral Large (24.11) 输入:$2.00 / 百万个词元
输出:$6.00 / 百万个词元
Mistral Large (24.07) 输入:$2.00 / 百万个词元
输出:$6.00 / 百万个词元
Mistral Nemo 输入:$0.15 / 百万个词元
输出:$0.15 / 百万个词元
Codestral (24.05) 输入:$0.20 / 百万个代币
输出:$0.60 / 百万个代币

申请定制报价

Google Cloud 采用随用随付的价格模式,您只需为实际使用的服务付费。请与我们的销售团队联系,获取为贵组织量身定制的报价。
联系销售团队