Vertex AI 价格

所列价格以美元 (USD) 为单位。 如果您使用非美元货币付费,请参阅 Cloud Platform SKU 上以您的币种列出的价格。

本页面介绍 Vertex AI 上的生成式 AI 的价格。如需了解包括机器学习平台和 MLOps 服务的所有其他 Vertex AI 价格,请参阅 Vertex AI 价格页面

Google 模型

Gemini

借助 Vertex AI 中的多模态模型,您可以输入文本或媒体(图片、视频)。文本输入按每 1,000 个字符输入(提示)和每 1,000 个字符输出(响应)计费。字符数按 UTF-8 码位计算,计数中不包含空格,因此每个词元大约包含 4 个字符。导致响应被滤除的预测请求仅对输入收费。在每个结算周期结束时,1 美分 ($0.01) 的小数部分会四舍五入为 1 美分。媒体输入按图片或每秒(视频)计费。

型号 功能 类型 价格
( =< 12.8 万个输入令牌)
价格
(超过 12.8 万个输入令牌)
Gemini 1.5 Flash 多模态 图片输入
视频输入
文本输入
音频输入
$0.00002 / 图片
$0.00002 / 秒
$0.00001875 / 1000 个字符
$0.000002 / 秒
$0.00004 / 图片
$0.00004 / 秒
$0.0000375 / 1000 个字符
$0.000004 / 秒
文本输出 $0.000075 / 1000 个字符 $0.00015 / 1000 个字符
调参* 训练令牌 $8 / M 个令牌
Gemini 1.5 Pro 多模态 图片输入
视频输入
文本输入
音频输入
$0.00032875 / 图片
$0.00032875 / 秒
$0.0003125 / 1000 个字符
$0.00003125 / 秒
$0.0006575 / 图片
$0.0006575 / 秒
$0.000625 / 1000 个字符
$0.0000625 / 秒
文本输出 $0.00125 / 1000 个字符 $0.0025 / 1000 个字符
调参* 训练令牌 $80 / M 个令牌
Gemini 1.0 Pro 多模态 图片输入
视频输入
文本输入
$0.0025/图片
$0.002/秒
$0.000125/1000 个字符
文本输出 $0.000375/1000 个字符
使用 Google 搜索建立依据 文本 依据请求 $35 / 1000 个请求(每天最多 100 万个请求)。
如果您需要每天超过 100 万个请求,
请与您的客户支持团队联系。

* 所列价格以美元 (USD) 为单位。 如果您使用非美元货币付费,请参阅 Cloud Platform SKU 上以您的币种列出的价格。
* 如果查询上下文超过 128K,则所有令牌均按较长的上下文费率计费。
* Gemini 模型以 50% 的折扣提供批量模式。
* Gemini 1.0 Pro 最多仅支持 32K 上下文窗口。
* PDF 文件按图片输入计费,一个 PDF 页面相当于一张图片。
* 已调参模型端点与基本模型的预测价格相同。
* 依据 Google 搜索进行依据:如果您使用动态检索来优化费用,则只有那些在响应中至少包含一个来自网络的依据支持网址的请求才需要为“依据 Google 搜索”付费。使用 Gemini 时需支付相关费用。

Imagen

借助 Vertex AI 上的 Imagen,您可以根据自己提供的文本提示生成新颖的图片并编辑图片,也可以使用您定义的蒙版区域以及许多其他功能,仅编辑部分图片。

模型 功能 说明 输入 输出 价格
图片标注 3 图片生成 生成图片 文本提示 Image 每张图片 $0.04
Imagen 3 快速 图片生成 生成图片 文本提示 Image 每张图片 $0.02
Imagen 2、Imagen 图片生成 生成图片 文本提示 映像 每个图片 $0.020
图片修改 使用无蒙版或蒙版方法修改图片 图片/文字提示 映像 每个图片 $0.020
提升 将生成的图片的分辨率提高到 2K 和 4K 映像 映像 每个映像 $0.003
微调 启用用户提供的“主题”以用于 Imagen 提示(少样本训练) 带有文本标识符的主题,每个主题 4-8 张图片 微调后的模型(使用用户提供的主题进行训练后) 每节点时 $(Vertex AI 自定义训练价格)
视觉标注 为图片生成短文本或长文本字幕 映像 文本字幕 $0.0015/图片
视觉问答 根据引用图片的问题提供回答 图片/文字提示 文本回答 $0.0015/图片

所列价格以美元 (USD) 为单位。 如果您使用非美元货币付费,请参阅 Cloud Platform SKU 上以您的币种列出的价格。

嵌入

模型 功能 说明 输入 输出 价格
多模态嵌入 Embeddings for Multimodal:文本 使用文本作为输入来生成嵌入 文本 Embeddings $0.0002/1,000 个字符输入
Embeddings for Multimodal:图片 使用图片作为输入来生成嵌入 映像 Embeddings $0.0001/图片输入
多模态嵌入:增强版视频 Video Plus 视频 嵌入(每分钟视频最多 15 项嵌入) 每秒视频 $0.0020
多模态嵌入:视频标准 Video Standard 视频 嵌入(每分钟视频最多 8 项嵌入) 每秒视频 $0.0010
多模态嵌入:视频基础知识 Video Essential 视频 嵌入(每分钟视频最多 4 项嵌入) 每秒视频 $0.0005
模型 类型 区域 每 1,000 个字符的价格
Embeddings for Text 输入 Global
  • 在线请求:$0.000025
  • 批量请求:$0.00002
输出 Global
  • 在线请求:免费
  • 批量请求:免费

所列价格以美元 (USD) 为单位。 如果您使用非美元货币付费,请参阅 Cloud Platform SKU 上以您的币种列出的价格。

代码补全

Vertex AI 上的生成式 AI 按每 1,000 个字符的输入(提示)和每 1,000 个字符的输出(回复)计费。字符按 UTF-8 码位计数,计数中不包括空格。在预览版阶段,费用享受 100% 的折扣。对于导致响应被滤除的预测请求,您只需为输入付费。在每个结算周期结束时,1 美分 ($0.01) 的小数部分会四舍五入为 1 美分。

模型 类型 区域 每 1,000 个字符的价格
Codey for Code Completion 输入 全球
  • 在线请求:$0.00025
输出 全球
  • 在线请求:$0.0005

所列价格以美元 (USD) 为单位。 如果您使用非美元货币付费,请参阅 Cloud Platform SKU 上以您的币种列出的价格。

翻译(文字)

使用 Vertex AI API 和翻译 LLM 翻译文本。与经典翻译模型相比,LLM 翻译往往更流利、更人性化,但对语言的支持相对有限(了解详情)

型号 方法 用量 每 100 万个字符的价格
LLM 文本翻译预览版* 每月输入字符数

每 100 万个字符 $10*

每月输出字符数

每 100 万个字符 $10*

所列价格以美元 (USD) 为单位。 如果您使用非美元货币付费,请参阅 Cloud Platform SKU 上以您的币种列出的价格。
*价格按模型处理的字符数计算。如需详细了解统计的字符数,请参阅计费字符

上下文缓存

借助上下文缓存,您可以将输入文本或媒体的上下文部分缓存到 Gemini 模型,从而将 Gemini 输入令牌的处理费用减少 75%,并减少内容生成延迟。“上下文缓存存储”费用取决于数据在缓存中的存储时长(可由用户控制)。创建缓存的上下文时,用户需要支付标准输入令牌的费用。输入数据的缓存命中按优惠费率(即“缓存输入”收费),而不是正常的输入费用。存储和输入的数据大小的计算方式与 Gemini 输入价格的计算方式相同。

模型 功能 类型 价格( =< 12.8 万个输入令牌) 价格(超过 12.8 万个输入令牌)
Gemini 1.5 Flash 缓存的输入 图片输入
视频输入
文本输入
音频输入
0.000005 / 图片
0.000005 / 秒
0.0000046875 / 1000 个字符
0.0000005 / 秒
0.00001 / 图片
0.00001 / 秒
0.000009375 / 1000 个字符
0.000001 / 秒
上下文缓存存储空间 图片输入
视频输入
文本输入
音频输入
0.000263 / 图片 / 小时
0.000263/ 秒 / 小时
0.00025 / 1000 个字符 / 小时
0.000025 / 秒 / 小时
Gemini 1.5 Pro 缓存的输入 图片输入
视频输入
文本输入
音频输入
0.0000821875 / 图片
0.0000821875 / 秒
0.000078125 / 1000 个字符
0.0000078125 / 秒
0.000164375 / 图片
0.000164375 / 秒
0.00015625 / 1000 个字符
0.000015625 / 秒
上下文缓存存储空间 图片输入
视频输入
文本输入
音频输入
0.0011835 / 图片 / 小时
0.0011835/ 秒 / 小时
0.001125 / 1000 个字符 / 小时
0.0001125 / 秒 / 小时

所列价格以美元 (USD) 为单位。 如果您使用非美元货币付费,请参阅 Cloud Platform SKU 上以您的币种列出的价格。

缓存费用计算示例

如果用户创建了包含 25 万个字符的缓存上下文,TTL 为 2 小时,然后在这 2 小时内向 Gemini 1.5 Pro 模型发送了 20 个不同的请求,并且每个请求在缓存上下文中添加了 200 个字符的查询,输出 400 个字符,则总费用按如下方式计算:

Cache Creation cost:
250,000 input characters x ($0.0003125 / 1000) = $0.078125 cached input cost.

Cache Storage cost:
250,000 characters x 2 hours = 500,000 total character hours;
500,000 total character hours x ($0.001125 / 1000) = $0.5625 storage cost.

Requests using cache cost:
200 characters x 20 requests = 4,000 total character inputs
250,000 cached characters * 20 requests = 5,000,000 total cached character inputs
4,000 total character inputs * ($0.0003125 / 1000) = $0.00125 character input cost
5,000,000 total cached character inputs * ($0.000078125 / 1000) = $0.390625 cached input cost
$0.00125 character input cost + $0.390625 cached input cost = $0.391875 total input cost

Output cost:
400 output characters x 20 prompts = 8,000 total output characters;
8,000 total output characters x ($0.00375 / 1000) = $0.03 output cost.

Total cost:
$0.078125 cached input cost + $0.5625 cached storage cost + $0.391875 input cost + $0.03 output cost = $1.0625 total cost.

费用计算示例

如果用户向 PaLM Text Bison 模型发送五个单独的请求,并且每个请求包含 200 个字符的输入和 400 个字符的输出,则总费用的计算方式如下:

Input cost:
200 input characters x 5 prompts = 1,000 total input characters;
1,000 total input characters x ($0.00025 / 1000) = $0.00025 input cost.

Output cost:
400 output characters x 5 prompts = 2,000 total output characters;
2,000 total output characters x ($0.0005 / 1000) = $0.001 output cost.

Total cost:
$0.00025 input cost + $0.001 output cost = $0.00125 total cost.

合作伙伴模型

合作伙伴模型是由 Google 合作伙伴开发的一系列精选生成式 AI 模型。合作伙伴模型以代管式 API 的形式提供。如需了解详情,请参阅合作伙伴模型概览。以下部分列出了 Google 合作伙伴型号的价格详情。

AI21 Lab 的模型

型号 价格
Jamba 1.5 Large 输入:$2 / 百万词元
输出:$8 / 百万词元
Jamba 1.5 Mini 输入:$0.20 / 百万词元
输出:$0.40 / 百万词元

Anthropic 的 Claude 模型

型号 价格
Claude 3.5 Haiku 输入:$1.00 / 百万词元
输出:$5.00 / 百万词元
Claude 3.5 十四行诗 v2 输入:$3 / 百万词元
输出:$15 / 百万词元
Claude 3.5 Sonnet 输入:$3 / 百万词元
输出:$15 / 百万词元
Claude 3 Haiku 输入:$0.25 / 100 万个词元
输出:$1.25 / 100 万个词元
Claude 3 Sonnet 输入:$3 / 百万词元
输出:$15 / 百万词元
Claude 3 Opus 输入:$15 / 百万词元
输出:$75 / 百万词元

Meta 的 Llama 模型

型号 价格
Llama 3.1 405B 输入:$5 / 百万词元
输出:$16 / 百万词元

Mistral AI 的模型

型号 价格
米斯特尔大号 (2407) 输入:$2 / 百万词元
输出:$6 / 百万词元
米斯特拉尔·尼莫 输入:$0.15 / 百万词元
输出:$0.15 / 百万词元
Codestral 输入:$0.20 / 百万词元
输出:$0.60 / 百万词元

申请定制报价

Google Cloud 采用随用随付的价格模式,您只需为实际使用的服务付费。请与我们的销售团队联系,获取为贵组织量身定制的报价。
联系销售团队