Vertex AI 价格
所列价格以美元 (USD) 为单位。 如果您使用非美元货币付费,请参阅 Cloud Platform SKU 上以您的币种列出的价格。
本页面介绍了 Vertex AI 上的生成式 AI 的价格。如需了解所有其他 Vertex AI 价格(包括机器学习平台和 MLOps 服务),请参阅 Vertex AI 价格页面。
Google 模型
Gemini
借助 Vertex AI 中的多模态模型,您可以输入文本或媒体(图片、视频)。文本输入按每 1,000 个字符的输入(提示)和每 1,000 个字符的输出(回复)计费。字符按 UTF-8 码位计数,计数中不包括空格,每个词元大约有 4 个字符。生成过滤后响应的预测请求仅针对输入计费。在每个结算周期结束时,1 美分的小数部分 ($0.01) 会四舍五入到 1 美分。媒体输入按图片数量或秒数(视频)收费。
型号 | 功能 | 类型 | 价格 (< 128K 输入词元) |
价格 (超过 128K 输入词元) |
---|---|---|---|---|
Gemini 1.5 Flash | 多模态 | 图片输入 视频输入 文本输入 音频输入 |
$0.00002 / 图片 $0.00002 / 秒 $0.00001875 / 1,000 个字符 $0.000002 / 秒 |
$0.00004 / 图片 $0.00004 / 秒 $0.0000375 / 1000 个字符 $0.000004 / 秒 |
文本输出 | $0.000075 / 1,000 个字符 | $0.00015 / 1,000 个字符 | ||
调优* | 培训令牌 | 8 美元 / 百万词元 | ||
Gemini 1.5 Pro | 多模态 | 图片输入 视频输入 文本输入 音频输入 |
$0.00032875 / 图片 $0.00032875 / 秒 $0.0003125 / 1,000 个字符 $0.00003125 / 秒 |
$0.0006575 / 图片 $0.0006575 / 秒 $0.000625 / 1,000 个字符 $0.0000625 / 秒 |
文本输出 | $0.00125 / 1,000 个字符 | $0.0025 / 1,000 个字符 | ||
调优* | 培训令牌 | 80 美元 / 百万词元 | ||
Gemini 1.0 Pro | 多模态 | 图片输入 视频输入 文本输入 |
$0.0025/图片 $0.002/秒 $0.000125/1000 个字符 |
|
文本输出 | $0.000375/1000 个字符 | |||
使用 Google 搜索建立依据 | 文本 | 以事实为依据的请求 | 每 1,000 次请求 35 美元(每天最多 100 万次请求)。 如果您需要每天超过 100 万次请求,请与您的客户支持团队联系。 |
* 所列价格以美元 (USD) 为单位。
如果您使用非美元货币付费,请参阅 Cloud Platform SKU 上以您的币种列出的价格。
* 如果查询上下文长度超过 12.8 万,则所有 token 都按长上下文费率收费。
* 批量模式下,Gemini 模型可享受 50% 的折扣。
* Gemini 1.0 Pro 仅支持最多 32K 的上下文窗口。
* PDF 按图片输入收费,1 个 PDF 页面等同于 1 张图片。
* 调优后的模型端点的预测价格与基础模型相同。
* 使用 Google 搜索进行基准化:如果您使用动态检索来优化费用,只有在响应中包含至少一个来自 Google 搜索的基准化支持网址的请求才会产生 Grounding with Google Search 费用。您始终需要支付 Gemini 费用。
Imagen
借助 Vertex AI 上的 Imagen,您可以根据您提供的文本提示生成新图片并修改图片,或使用您定义的遮盖区域以及许多其他功能仅修改图片的某些部分。
模型 | 功能 | 说明 | 输入 | 输出 | 价格 |
---|---|---|---|---|---|
Imagen 3 | 图片生成 | 生成图片 | 文本提示 | Image | 每张图片 $0.04 |
Imagen 3 Fast | 图片生成 | 生成图片 | 文本提示 | Image | 每张图片 $0.02 |
Imagen 2、Imagen | 图片生成 | 生成图片 | 文本提示 | 映像 | 每个图片 $0.020 |
图片修改 | 使用无蒙版或蒙版方法修改图片 | 图片/文字提示 | 映像 | 每个图片 $0.020 | |
提升 | 将生成的图片的分辨率提高到 2K 和 4K | 映像 | 映像 | 每个映像 $0.003 | |
微调 | 启用用户提供的“主题”以用于 Imagen 提示(少样本训练) | 带有文本标识符的主题,每个主题 4-8 张图片 | 微调后的模型(使用用户提供的主题进行训练后) | 每节点时 $(Vertex AI 自定义训练价格) | |
视觉标注 | 为图片生成短文本或长文本字幕 | 映像 | 文本字幕 | $0.0015/图片 | |
视觉问答 | 根据引用图片的问题提供回答 | 图片/文字提示 | 文本回答 | $0.0015/图片 |
所列价格以美元 (USD) 为单位。 如果您使用非美元货币付费,请参阅 Cloud Platform SKU 上以您的币种列出的价格。
嵌入
模型 | 功能 | 说明 | 输入 | 输出 | 价格 |
---|---|---|---|---|---|
多模态嵌入 | Embeddings for Multimodal:文本 | 使用文本作为输入来生成嵌入 | 文本 | Embeddings | $0.0002/1,000 个字符输入 |
Embeddings for Multimodal:图片 | 使用图片作为输入来生成嵌入 | 映像 | Embeddings | $0.0001/图片输入 | |
Embeddings for Multimodal:视频加 | Video Plus | 视频 | 嵌入(每分钟视频最多 15 项嵌入) | 每秒视频 $0.0020 | |
Embeddings for Multimodal:视频标准 | Video Standard | 视频 | 嵌入(每分钟视频最多 8 项嵌入) | 每秒视频 $0.0010 | |
Embeddings for Multimodal:视频基本信息 | Video Essential | 视频 | 嵌入(每分钟视频最多 4 项嵌入) | 每秒视频 $0.0005 |
模型 | 类型 | 区域 | 每 1,000 个字符的价格 |
---|---|---|---|
Embeddings for Text | 输入 | Global |
|
输出 | Global |
|
所列价格以美元 (USD) 为单位。 如果您使用非美元货币付费,请参阅 Cloud Platform SKU 上以您的币种列出的价格。
代码补全
Vertex AI 上的生成式 AI 按每 1,000 个字符的输入(提示)和每 1,000 个字符的输出(回复)计费。字符按 UTF-8 码位计数,计数中不包括空格。在预览版阶段,费用享受 100% 的折扣。生成过滤后响应的预测请求仅针对输入计费。在每个结算周期结束时,1 美分的小数部分 ($0.01) 会四舍五入到 1 美分。
模型 | 类型 | 区域 | 每 1,000 个字符的价格 |
---|---|---|---|
Codey for Code Completion | 输入 | 全球 |
|
输出 | 全球 |
|
所列价格以美元 (USD) 为单位。 如果您使用非美元货币付费,请参阅 Cloud Platform SKU 上以您的币种列出的价格。
翻译(文本)
使用 Vertex AI API 和翻译 LLM 来翻译文本。与传统翻译模型相比,LLM 翻译的语言通常更流畅、更贴近人类语言,但支持的语言较少(了解详情)。
型号 | 方法 | 用量 | 每百万字符的价格 |
---|---|---|---|
LLM | 文字翻译(预览版)* | 每月输入字符数 |
每 1000 万个字符 $10* |
每月输出字符数 |
每 1000 万个字符 $10* |
所列价格以美元 (USD) 为单位。
如果您使用非美元货币付费,请参阅 Cloud Platform SKU 上以您的币种列出的价格。
* 价格按模型处理的字符数计算。如需详细了解会对哪些字符计费,请参阅计费字符
上下文缓存
通过上下文缓存,你可以将 Gemini 输入词元处理费用降低 75%,并将内容生成延迟时间缩短到 100 毫秒。数据在缓存中存储的时间长度(可由用户控制)决定了“Context Cache Storage”的费用。在创建缓存的上下文时,用户将被收取标准输入代币费用。输入数据的缓存命中将按较低的费率(“缓存输入”)收费,而不是按正常的输入费用收费。存储和输入的数据大小采用与 Gemini 输入价格相同的计算方式。
模型 | 功能 | 类型 | 价格(= 128K 输入令牌) | 价格(超过 128K 输入词元) |
---|---|---|---|---|
Gemini 1.5 Flash | 缓存的输入 | 图片输入 视频输入 文本输入 音频输入 |
0.000005 美元 / 图片 0.000005 美元 / 秒 0.0000046875 美元 / 1,000 个字符 0.0000005 美元 / 秒 |
0.00001 美元 / 图片 0.00001 美元 / 秒 0.000009375 美元 / 1,000 个字符 0.000001 美元 / 秒 |
上下文缓存空间 | 图片输入 视频输入 文本输入 音频输入 |
0.000263 美元 / 小时 / 图片 0.000263 美元/ 小时 / 秒 0.00025 美元 / 小时 / 1,000 个字符 0.000025 美元 / 小时 / 秒 |
||
Gemini 1.5 Pro | 缓存的输入 | 图片输入 视频输入 文本输入 音频输入 |
0.0000821875 美元 / 图片 0.0000821875 美元 / 秒 0.000078125 美元 / 1,000 个字符 0.0000078125 美元 / 秒 |
0.000164375 美元 / 图片 0.000164375 美元 / 秒 0.00015625 美元 / 1,000 个字符 0.000015625 美元 / 秒 |
上下文缓存空间 | 图片输入 视频输入 文本输入 音频输入 |
0.0011835 / 图片 / 小时 0.0011835/ 秒 / 小时 0.001125 / 1,000 个字符 / 小时 0.0001125 / 秒 / 小时 |
所列价格以美元 (USD) 为单位。 如果您使用非美元货币付费,请参阅 Cloud Platform SKU 上以您的币种列出的价格。
缓存费用计算示例
如果用户创建一个 250,000 个字符的缓存上下文,并且该上下文的 TTL 为 2 小时,随后在 2 小时内向 Gemini 1.5 Pro 模型发送 20 个单独的请求,并且每个请求都包含添加到缓存上下文的 200 个字符的查询和 400 个字符的输出,则总费用的计算方式如下:
Cache Creation cost:
250,000 input characters x ($0.0003125 / 1000) = $0.078125 cached input cost.
Cache Storage cost:
250,000 characters x 2 hours = 500,000 total character hours;
500,000 total character hours x ($0.001125 / 1000) = $0.5625 storage cost.
Requests using cache cost:
200 characters x 20 requests = 4,000 total character inputs
250,000 cached characters * 20 requests = 5,000,000 total cached character inputs
4,000 total character inputs * ($0.0003125 / 1000) = $0.00125 character input cost
5,000,000 total cached character inputs * ($0.000078125 / 1000) = $0.390625 cached input cost
$0.00125 character input cost + $0.390625 cached input cost = $0.391875 total input cost
Output cost:
400 output characters x 20 prompts = 8,000 total output characters;
8,000 total output characters x ($0.00375 / 1000) = $0.03 output cost.
Total cost:
$0.078125 cached input cost + $0.5625 cached storage cost + $0.391875 input cost + $0.03 output cost = $1.0625 total cost.
费用计算示例
如果用户向 PaLM Text Bison 模型发送五个单独的请求,并且每个请求包含 200 个字符的输入和 400 个字符的输出,则总费用的计算方式如下:
Input cost:
200 input characters x 5 prompts = 1,000 total input characters;
1,000 total input characters x ($0.00025 / 1000) = $0.00025 input cost.
Output cost:
400 output characters x 5 prompts = 2,000 total output characters;
2,000 total output characters x ($0.0005 / 1000) = $0.001 output cost.
Total cost:
$0.00025 input cost + $0.001 output cost = $0.00125 total cost.
合作伙伴模型
合作伙伴模型是由 Google 合作伙伴开发的一系列精选生成式 AI 模型。合作伙伴模型以托管式 API 的形式提供。如需了解详情,请参阅合作伙伴模型概览。 以下部分列出了 Google 合作伙伴模型的价格详情。
AI21 Lab 的模型
型号 | 价格 |
---|---|
Jamba 1.5 Large | 输入:$2 / 100 万个词元 输出:$8 / 100 万个词元 |
Jamba 1.5 Mini | 输入:$0.20 / 百万个代币 输出:$0.40 / 百万个代币 |
Anthropic 的 Claude 模型
型号 | 价格 |
---|---|
Claude 3.5 Haiku | 输入:$1.00 / 百万个词元 输出:$5.00 / 百万个词元 |
Claude 3.5 Sonnet v2 | 输入:$3 / 百万个词元 输出:$15 / 百万个词元 |
Claude 3.5 Sonnet | 输入:$3 / 百万个词元 输出:$15 / 百万个词元 |
Claude 3 Haiku | 输入:$0.25 / 百万个令牌 输出:$1.25 / 百万个令牌 |
Claude 3 Sonnet | 输入:$3 / 百万个词元 输出:$15 / 百万个词元 |
Claude 3 Opus | 输入:$15 / 百万个词元 输出:$75 / 百万个词元 |
Meta 的 Llama 模型
型号 | 价格 |
---|---|
Llama 3.1 405B | 输入:$5.00 / 百万个词元 输出:$16.00 / 百万个词元 |
Mistral AI 的模型
型号 | 价格 |
---|---|
Mistral Large (24.11) | 输入:$2.00 / 百万个词元 输出:$6.00 / 百万个词元 |
Mistral Large (24.07) | 输入:$2.00 / 百万个词元 输出:$6.00 / 百万个词元 |
Mistral Nemo | 输入:$0.15 / 百万个词元 输出:$0.15 / 百万个词元 |
Codestral (24.05) | 输入:$0.20 / 百万个代币 输出:$0.60 / 百万个代币 |