Vertex AI Search 价格
所列价格以美元 (USD) 为单位。
所列正式版 (GA) 功能的价格将于 2023 年 9 月 1 日生效。
Vertex AI Search 让开发者(即使是机器学习技能有限的开发者)也能利用 Google 的基础大语言模型、搜索和推荐专业知识,创建企业级生成式 AI 应用
Vertex AI Search 支持快速构建网站、非结构化数据和结构化数据搜索引擎,以检索信息并生成有依据的答案。您可以详细了解 Vertex AI Search 中提供的功能。
Vertex AI Search 提供两种价格模式:常规和可配置。您必须为搜索应用及其关联的数据存储区选择一个模型。
| 一般价格 | 可配置的价格 | |
|---|---|---|
| 适用场景 | 快速入门 查询次数少于 1500 万的工作负载 流量不可预测 |
每月查询量超过 1500 万的工作负载 需要可预测的流量 / 吞吐量 需要灵活性,不必始终对所有查询使用语义搜索 |
| 价格计量 | 按查询次数和编入索引的数据量(以 GB 为单位)付费 | 按月订阅查询容量 (QPM) 和存储空间,高级附加功能按查询付费 |
重要提示:使用可配置价格模式创建的数据存储区只能由同样使用可配置价格模式的搜索应用使用。
Vertex AI Search 一般价格
此模型基于搜索查询和数据存储的随用随付定价。
免费试用:每个账号每个月可以免费使用 10,000 次查询,您不需要初始投资就可以开始探索 Vertex AI Search。不包括高级生成式回答。
搜索查询价格
| Search Standard Edition 包含语义检索和 KPI 优化 |
$1.50 / 1,000 次查询 | |
|---|---|---|
| Search 企业版 包含语义检索、KPI 优化和核心生成式回答(AI 模式) |
$4.00 / 1,000 次查询 | |
| 高级生成式回答(AI 模式) (可添加到标准版和企业版) |
+$4.00 / 1,000 次用户输入查询 | |
|
Search Standard Edition - 非结构化搜索 + 结构化搜索功能 Search Enterprise Edition - 非结构化搜索 + 结构化搜索 + 网站搜索功能 Vertex AI Search Enterprise Edition 包含核心生成式回答(AI 模式)。提供答案、摘要和跟进,无需额外付费。注意:核心生成式回答不包括跟进搜索建议、复杂查询处理、长查询处理和多模态功能。 高级生成式回答功能包括跟进搜索建议、复杂查询处理和多模态等高级功能。 查询:按单个请求或查询输入计量费用 请求或查询是指对 Enterprise Search 的任何 API 调用,无论是使用 API 直接调用,还是使用集成或控制台间接调用。 例如,当用户提出一个自然语言问题,搜索引擎给出回答时,这算作一个查询。 高级生成式回答(AI 模式)现为 添加到查询中,以增强处理以使用生成式 AI 功能, 高级生成式回答(AI 模式)可与 Search Standard Edition 或 Search Enterprise Edition 互换使用。 示例:执行包含多模态请求的 Search Enterprise 查询 = 1 个 Search Enterprise 查询 + 1 个高级生成式回答(AI 模式)查询 |
||
索引 / 数据存储价格
请参阅“索引存储空间价格”部分
Vertex AI Search 正式版功能的价格示例
非结构化数据示例:文档搜索
假设:
- 每年 1,000 万次标准版查询
- 每年 1,000 万次企业版查询,其中 200 万次为高级生成式回答(AI 模式)查询
- 10 万个文档,每个文档约 1 MB
| SKU 数量 | 费率 | 总定价 |
|---|---|---|
| 标准搜索广告系列 | ||
| 每年 1 千万(免费试用 1 万) | * $1.50 / 1,000 次查询 = | $14,985 |
| Search Enterprise,包含核心生成式回答(AI 模式) | ||
| 每年 1 千万(免费试用 1 万) | * $4.00 / 1 千次查询 = | $39,960 |
| 高级生成式回答(AI 模式) 添加到标准查询或企业查询中的每个查询 |
||
| 200 万 | * +$4.00 / 1,000 次用户输入查询 = | +$8,000 |
| 编入索引的数据 | ||
| 100GB/年 10GB 免费,因此价格计算中使用了 90GB | * $5.00 / GB * 12 个月 = | $5,400 |
Vertex AI Search 可配置的价格
此模型通过按月订阅核心搜索容量来提供可预测的费用,并提供随用随付的可选附加功能。它专为工作负载稳定且希望更好地控制成本的客户而设计。
最低每月承诺:每分钟 1,000 次查询 (QPM) 和 50 GB 存储空间。
核心订阅价格(按月结算)
| SKU | 价格 | 说明 |
|---|---|---|
| 查询单元 | $6.00 / QPM / 月 | 搜索应用查询吞吐量容量的订阅 |
| 存储单元 | $1.00 / GB / 月 | 用于存储原始数据以进行索引编制的订阅 |
随用随付附加服务(按每 1,000 次查询计费)
| 加购 | 价格 | 说明 |
|---|---|---|
| 语义 | $0.75 / 1,000 次查询 + $1.50 / GB / 月(嵌入) | 支持语义理解和混合搜索,是 AI 概览和 AI 模式的必要条件。 额外存储费用涵盖生成和维护嵌入的费用。 |
| KPI 和个性化 | $0.20 / 1,000 次查询 | 支持事件重新排名和个性化,以优化业务 KPI(互动度、转化率) |
| 核心生成式回答 | $2.00 / 1,000 次查询 | 生成答案、引用和后续跟进。需要语义插件。 |
| 高级生成式回答(AI 模式) | $4.00 / 1,000 次查询 | 处理复杂的多轮对话式查询和多模态。需要语义插件。 |
超额用量:用量超出订阅的 QPM 即视为超额用量。默认情况下,超出配额的查询将按通用价格模式的标准版费率($1.50 / 1,000 次查询)计费。
扩容:您可以随时扩容 QPM 或存储空间订阅,费用将按当月剩余天数比例计算。缩减将在下一个结算周期开始时生效。
Vertex AI Search 可配置价格示例
结构化数据示例:酒店搜索
假设:
- 100 万个文档(目录项),每个文档约 100 KB
- 1500 Query Per Minute 包月订阅
- 每月 5,000 万次查询,并提供 KPI 优化插件
- 每月 3,000 万次查询,使用语义附加服务
- 每月 1,000 万次查询,使用核心生成式回答(AI 概览)
| SKU 数量 | 费率 | 总定价 |
|---|---|---|
| 核心订阅 - 查询单元 | ||
| 每分钟 1500 次查询 | * $6.00 / QPM x 月订阅 = | $9,000 |
| 核心订阅 - 存储单元 | ||
| 100 GB | * $1/GB x 月订阅 = | $100 |
| 插件 - 语义索引 | ||
| 100 GB | * $1.50 / GB x 月 | $150 |
| 插件 - 语义查询 | ||
| 3,000 万 | * $0.75 / 1,000 次查询 | $22,500 |
| 附加功能 - KPI 和个性化 | ||
| 5,000 万 | * $0.20 / 1,000 次查询 | $10,000 |
| 附加功能 - 核心生成式回答 | ||
| 1000 万 | * $2.00 / 1,000 次查询 | $20,000 |
索引存储价格
Vertex AI Search 索引数据存储的价格
| 索引存储 | 每月每 GiB 原始数据 $5.00 |
|---|---|
|
* 每月提供 10 GiB 的免费配额 ** 在 Vertex AI Search 中共享 ***索引存储费用按原始数据的总大小计算,定期采样并计算为当月的平均值。刷新数据的操作不会产生额外费用。 **** 对于网站数据存储区,存储空间的计算方法为:500 千比字节 (KiB) * “网站上的网页数”, 其中 1 KiB 为 1,024 个字节。(500 KiB 约为 0.000477 GiB;因此数据索引 1000 页网站的价格是每月 2.38 美元。) |
|
Vertex AI Search for Healthcare 价格
Vertex AI Search for Healthcare 可帮助您快速构建针对医疗保健数据进行医学调优的搜索引擎。
| Healthcare Search | $20.00 / 1,000 次查询 |
|---|
Vertex AI Search for Healthcare 包含一些预览版功能,例如生成式 AI 回答、索引流式更新等。这些功能正式发布后,价格可能会与当前列出的价格有所不同。
医疗保健搜索价格示例
假设:
每月 1,000,000 次医疗保健搜索请求
1,000 GiB 的医疗保健数据已编入索引
| SKU 数量 | 费率 | 总定价 |
|---|---|---|
| 1,000,000 次搜索 | $20/1000 | $20,000 |
| 1,000 GiB | $5/GiB | $5,000 |
Vertex AI Search for Media 价格
借助 Vertex AI Search for Media,您可以利用 Google 的查询和上下文理解能力,在媒体网站上提供高度相关的视频结果,从而改善发现体验。
| Vertex AI Search:数据索引 | 每月 $5.00 / GB |
|---|---|
| Vertex AI Search:媒体搜索 API 请求数 | 每 1,000 次查询 $2.00 |
Vertex AI Search 媒体推荐价格
会产生费用的 Media Recommendations 操作仅有训练、调优操作以及调用 recommend 方法请求预测的操作。导入或管理用户事件或文档信息不收取任何费用。
如果模型正在训练或者您提交了继续训练的请求,则训练(按每小时每节点计)费用是按天来收取的。暂停或删除模型后,您无需继续支付费用。请参阅关于管理训练的文档。
活跃模型的调优(按每小时每节点计)费用在调优成功完成后开始计算。仅当您在调节过程中暂停或删除模型时,才会将未完成调节的费用计入您名下。在这种情况下,您需要为模型调优停止前所使用的节点时付费。请参阅有关管理调节的文档。
| 每月预测请求数 | $0.20 / 1,000 次预测 |
|---|---|
| 训练和调优 | 每个节点每小时$2.50 |
媒体推荐的价格示例
假设:
每月 10 亿次预测请求
每天训练一个模型,该模型每天自动重新训练一次
每月大约需要 500 个节点时的模型训练和 100 个小时的模型调优
| SKU 数量 | 费率 | 总定价 |
|---|---|---|
| 10 亿次预测 | * $0.20 / 1,000 次预测 = | $200,000 |
| 500 个节点时(训练) | * $2.50 / 小时 = | $1,250 |
| 100 个节点时(调优) | * $2.50 / 小时 = | $250 |
| 总计 | $201,500 | |
Google Cloud Observability 费用
针对导致错误的每个 API 请求,例如包含错误格式 JSON 的用户事件请求或价格为负的文档导入请求,Media Recommendations 会将错误记录到 Google Cloud Observability 中。对于文档未包含在导入的数据存储区中的每个预测请求,Media Recommendations 也会记录相应错误。
Google Cloud Observability 按存储的日志 GiB 数收费,并针对超过默认保留期限的保留时间收费。如需了解免费配额和数据保留的详细信息,请参阅 Google Cloud Observability 价格页面。
日志记录数据的大小取决于 JSON 载荷的大小,但 1 GiB 大约可存储 20 万条 Media Recommendations 错误。
Grounded Generation API 价格
借助 Grounded Generation API,您可以使用 Google 搜索上的信息或您自己的数据,针对提示生成回答。
| 输入提示(包括用户提示、系统指令和内联接地事实) | 按所选 Gemini 模型的价格收费。 |
| 输出 | 按所选 Gemini 模型的价格收费。 |
| Grounded Generation,用于根据您检索到的数据建立依据 | $2.50 / 1,000 个请求 |
| Grounded Generation:依托 Google 搜索结果进行接地 | 请参阅依托 Google 搜索进行接地。 |
| 数据检索的额外费用取决于所选的检索系统(例如 Vertex AI Search)。 | |
示例 1:依托 Vertex AI Search 进行接地,并提供内嵌接地事实
用户使用 Vertex AI Search 和其他依据事实来生成有依据的答案。每个输入提示包含 2,500 个字符(包括内联接地事实),每个输出提示包含 200 个字符。用户选择了 Gemini 1.5 Flash。
| 每个请求的卷 | 每 1,000 个请求的价格 | |
|---|---|---|
| 输入提示 | 2,500 个字符 | 1,000 个请求 * $0.000125/1,000 个字符 * 2,500 个字符/请求 = $0.3125/1,000 个请求 |
| 输出 | 200 characters | 1,000 个请求 * $0.000375/1,000 个字符 * 每个请求 2 个字符 = $0.075/1,000 个请求 |
| Grounded Generation,用于根据您检索到的数据建立依据 | 1 个请求 | 每 1,000 个请求$2.50 |
| 数据检索:Vertex AI Search(企业版) | 1 个请求 | 每 1,000 次请求$4.00 |
| 总计:每 1,000 次请求 6.8875 美元 |
示例 2:依托 Google 搜索进行接地
用户使用 Google 搜索生成有依据的答案。每个输入提示的长度为 500 个字符,每个输出提示的长度为 200 个字符。用户选择了 Gemini 1.5 Flash。
| 每个请求的卷 | 每 1,000 个请求的价格 | |
|---|---|---|
| 输入提示 | 500 个字符 | 1,000 个请求 * $0.000125/1,000 个字符 * 500 个字符/请求 = $0.0625/1,000 个请求 |
| 输出 | 200 characters | 1,000 个请求 * $0.000375/1,000 个字符 * 200 个字符/请求 = $0.075/1,000 个请求 |
| Grounded Generation:依托 Google 搜索结果进行接地 | 1 个请求 | 每 1,000 个请求$35.00 |
| 总计:每 1,000 个请求 $35.1375 |
查看 Grounding API 价格
Check grounding(检查接地)功能可确定一段文本(回答候选)在给定的一组参考文本(事实)中的接地程度。
| Check Grounding | 每 1,000 个回答字符 $0.00075 |
Document AI 功能价格
如需了解所有 Document AI 功能的完整价格信息,请参阅 Document AI 价格页面。
对于通过 Vertex AI Search 集成和计费的 Document AI 功能,请参阅下表。
数字化文本
| 处理器 | 每月 1 - 5,000,000 页 * | 每月 5,000,001 页以上 |
|---|---|---|
| Enterprise Document OCR 处理器 | 之后每 1,000 页 $1.50 | 每 1000 页 $0.60 |
从文档中提取结构和实体
| 布局解析器(包括初始分块) | 每 1,000 页 $10 |
*页面大小取决于文件格式。
图片(JPEG/JPG、PNG、BMP、HEIF):每张图片 = 1 页
PDF:PDF 中的每一页 = 1 页
TIFF:TIFF 中的每张图片 = 1 页
Word (DOCX):最多 3,000 个字符 = 1 页
Excel (XLSX):每个标签页 = 1 页
Powerpoint (PPTX):每张幻灯片 = 1 页
HTML:最多 3,000 个字符 = 1 页
已解析文档:最多 3,000 个字符 = 1 页
Ranking API 价格
Ranking API 会接收一个文档列表作为输入,然后根据这些文档与查询的相关程度对它们进行重新排名。
与仅关注文档和查询的语义相似度的嵌入相比,Ranking API 可以针对文档回答给定查询的效果提供精确的分数。
在检索到初始候选文档集后,可以使用排名 API 来提高搜索结果的质量。
对文档进行排名
| 排名 | 每 1,000 次查询 $1 |
|---|
查询定义为最多包含 100 个文档,但用户可以为每个查询指定超过 100 个文档。如果指定的文档超过 100 份,则每增加 100 份文档,价格就会增加 1。
例如:
132 个文档进行排名 = 2 个查询
200 个文档进行排名 = 2 个查询
399 个文档进行排名 = 4 个查询
401 个文档进行排名 = 5 次查询
后续步骤
- 阅读 Vertex AI Search 文档。
- 试用价格计算器。