此页面由 Cloud Translation API 翻译。

Google 模型

精选 Gemini 模型

2.5 Pro

我们最先进的推理 Gemini 模型，可解决复杂问题

擅长多模态理解
能够处理复杂的提示并提供全面的回答
最适合编码，尤其是 Web 开发

2.5 Flash

在性价比方面表现出色的模型，可提供全面的功能

针对部分端点添加了对 Live API 的支持
可在回答中查看模型的思考过程
兼顾价格和性能

2.5 Flash-Lite

我们最具成本效益的模型，可支持高吞吐量任务

2.5 系列模型中最快的模型
与 2.5 Flash 一样，具有 100 万个 token 的上下文窗口和多模态输入功能
在大多数评估基准上优于 2.0 Flash

已正式推出的 Gemini 模型

diamond Gemini 2.5 Pro 我们迄今为止最先进的推理模型

spark Gemini 2.5 Flash 在性价比方面表现出色的模型，提供全面的功能

photo_spark Gemini 2.5 Flash Image 我们的标准模型已升级，新增图片生成和对话式多轮修改功能，助您实现快速创意工作流

performance_auto Gemini 2.5 Flash-Lite 我们最具成本效益的模型，支持高吞吐量任务

spark Gemini 2.0 Flash 我们最新的多模态模型，具有新一代功能和改进的功能

performance_auto Gemini 2.0 Flash-Lite 一款经过优化的 Gemini 2.0 Flash 模型，具有出色的成本效益和低延迟

预览 Gemini 模型

mic_detect_auto Gemini 2.5 Flash Live API 我们的标准模型已升级，新增流式传输功能，可提供实时对话体验

Gemma 模型

Gemma 3n 最新的开放模型，专为在低资源设备上高效执行任务而设计，能够处理多模态输入（文本、图片、视频和音频输入）并生成文本输出，可使用 140 多种语言的数据进行训练

Gemma 3 第三代开放模型，能够处理文本和图片输入，解决各种任务，支持 140 多种语言，并提供长达 128K 的上下文窗口

Gemma 2 第二代开放模型，支持文本生成、总结和提取

Gemma 一种小型、轻量级的开放模型，支持文本生成、总结和提取

ShieldGemma 2 经过指令调优的模型，用于根据一组已定义的安全政策评估文本和图片的安全程度

PaliGemma 结合了 SigLIP 和 Gemma 的开放式视觉语言模型

CodeGemma 功能强大的轻量级开放模型，可执行各种编码任务，例如中间填充代码补全、代码生成、自然语言理解、数学推理和指令遵循

TxGemma 根据治疗相关数据生成预测、分类或文本，可用于高效构建 AI 模型，以处理治疗相关任务，且所需的数据和计算资源较少

MedGemma 一组经过训练的 Gemma 3 变体，在医学文本和图片理解方面表现出色

MedSigLIP 经过训练的 SigLIP 变体，可将医学图片和文本编码到通用嵌入空间中

T5Gemma Google 推出的一系列功能强大的轻量级编码器-解码器研究模型

嵌入模型

width_normal 文本嵌入将文本数据转换为向量表示形式，以用于语义搜索、分类、聚类和类似任务

width_normal 多模态嵌入基于图片生成向量，这些向量可用于图片分类、图片搜索等下游任务

已正式推出的 Imagen 模型

photo_spark Imagen 4 for Generation 使用文本提示生成新颖图片，且图片质量比我们之前的图片生成模型更高

photo_spark Imagen 4 for Fast Generation 使用文本提示生成新颖图片，且图片质量比我们之前的图片生成模型更高、延迟更低

photo_spark Imagen 4 for Ultra Generation 使用文本提示生成新颖图片，且图片质量比我们之前的图片生成模型更高、提示遵循度更高

photo_spark Imagen 3 for Generation 使用文本提示生成新颖图片

image_edit_auto Imagen 3 for Editing and Customization 使用文本提示修改现有输入图片或通过蒙版修改图片的某些部分，或根据输入参考图片提供的上下文生成新图片

photo_spark Imagen 3 for Fast Generation 使用文本提示生成新颖图片，延迟时间比我们的其他图片生成模型更短

subtitles Imagen for Captioning & VQA 使用文本提示生成新颖图片、修改现有图片、使用蒙版修改图片的某些部分等

预览版 Imagen 模型

photo_spark 虚拟试穿生成穿着服装产品的人物图片。

image_edit_auto Imagen Product Recontext on Vertex AI 使用文本提示将产品图片修改为不同的场景或背景。

Veo 模型

movie Veo 2 使用文本提示和图片生成新颖视频

movie Veo 3 使用文本提示和图片生成新颖视频，且视频质量比我们之前的视频生成模型更高

movie Veo 3 Fast 使用文本提示和图片生成新颖视频，且视频质量比我们之前的视频生成模型更高、延迟更低

预览版 Veo 模型

movie Veo 3 预览版使用文本提示和图片生成新视频，质量比我们之前的视频生成模型更高

movie Veo 3 快速预览版使用文本提示和图片生成新视频，质量比我们之前的视频生成模型更高，延迟更低

movie Veo 3.1 预览版使用文本提示和图片生成新视频，质量比我们之前的视频生成模型更高

movie Veo 3.1 快速预览版使用文本提示和图片生成新视频，质量比我们之前的视频生成模型更高，延迟更低

movie Veo 2 预览版使用文本提示和图片生成新视频。此模型版本支持局部重绘和扩展重绘。

实验性 Veo 模型

movie Veo 2 实验版一个实验性模型，具有正在测试的功能。

MedLM 模型

medical_information MedLM-medium 一组符合 HIPAA 要求的医学调优模型，旨在帮助医疗保健从业者完成医学类问答任务，以及对医疗保健和医学文档进行总结

clinical_notes MedLM-large-large 一组符合 HIPAA 要求的医学调优模型，旨在帮助医疗保健从业者完成医学类问答任务，以及对医疗保健和医学文档进行总结

语言支持

Gemini

所有 Gemini 模型都可以理解并以以下语言提供回答：

南非荷兰语 (af)、阿尔巴尼亚语 (sq)、阿姆哈拉语 (am)、阿拉伯语 (ar)、亚美尼亚语 (hy)、阿萨姆语 (as)、阿塞拜疆语 (az)、巴斯克语 (eu)、白俄罗斯语 (be)、孟加拉语 (bn)、波斯尼亚语 (bs)、保加利亚语 (bg)、加泰罗尼亚语 (ca)、宿务语 (ceb)、中文（简体和繁体）(zh)、科西嘉语 (co)、克罗地亚语 (hr)、捷克语 (cs)、丹麦语 (da)、迪维希语 (dv)、荷兰语 (nl)、英语 (en)、世界语 (eo)、爱沙尼亚语 (et)、菲律宾语（他加禄语）(fil)、芬兰语 (fi)、法语 (fr)、弗里斯兰语 (fy)、加利西亚语 (gl)、格鲁吉亚语 (ka)、德语 (de)、希腊语 (el)、古吉拉特语 (gu)、海地克里奥尔语 (ht)、豪萨语 (ha)、夏威夷语 (haw)、希伯来语 (iw)、印地语 (hi)、苗语 (hmn)、匈牙利语 (hu)、冰岛语 (is)、伊博语 (ig)、印度尼西亚语 (id)、爱尔兰语 (ga)、意大利语 (it)、日语 (ja)、爪哇语 (jv)、卡纳达语 (kn)、哈萨克语 (kk)、高棉语 (km)、韩语 (ko)、克里奥语 (kri)、库尔德语 (ku)、吉尔吉斯语 (ky)、老挝语 (lo)、拉丁语 (la)、拉脱维亚语 (lv)、立陶宛语 (lt)、卢森堡语 (lb)、马其顿语 (mk)、马达加斯加语 (mg)、马来语 (ms)、马拉雅拉姆语 (ml)、马耳他语 (mt)、毛利语 (mi)、马拉地语 (mr)、梅泰语（曼尼普尔语）(mni-Mtei)、蒙古语 (mn)、缅甸语 (my)、尼泊尔语 (ne)、挪威语 (no)、尼扬加语（齐切瓦语）(ny)、奥迪亚语（奥里亚语）(or)、普什图语 (ps)、波斯语 (fa)、波兰语 (pl)、葡萄牙语 (pt)、旁遮普语 (pa)、罗马尼亚语 (ro)、俄语 (ru)、萨摩亚语 (sm)、苏格兰盖尔语 (gd)、塞尔维亚语 (sr)、塞索托语 (st)、绍纳语 (sn)、信德语 (sd)、僧伽罗语（锡兰语）(si)、斯洛伐克语 (sk)、斯洛文尼亚语 (sl)、索马里语 (so)、西班牙语 (es)、巽他语 (su)、斯瓦希里语 (sw)、瑞典语 (sv)、塔吉克语 (tg)、泰米尔语 (ta)、泰卢固语 (te)、泰语 (th)、土耳其语 (tr)、乌克兰语 (uk)、乌尔都语 (ur)、维吾尔语 (ug)、乌兹别克语 (uz)、越南语 (vi)、威尔士语 (cy)、科萨语 (xh)、意第绪语 (yi)、约鲁巴语 (yo) 和祖鲁语 (zu)。

Gemma

Gemma 和 Gemma 2 仅支持英语 (en)。Gemma 3 和 Gemma 3n 支持 140 多种语言。

Embeddings

多语言文本嵌入模型支持以下语言：

南非荷兰语 (af)、阿尔巴尼亚语 (sq)、阿姆哈拉语 (am)、阿拉伯语 (ar)、亚美尼亚语 (hy)、阿塞拜疆语 (az)、巴斯克语 (eu)、白俄罗斯语 (be)、孟加拉语 (bn)、保加利亚语 (bg)、加泰罗尼亚语 (ca)、宿务语 (ceb)、中文（简体和繁体）(zh)、科西嘉语 (co)、捷克语 (cs)、丹麦语 (da)、荷兰语 (nl)、英语 (en)、世界语 (eo)、爱沙尼亚语 (et)、菲律宾语（他加禄语）(fil)、芬兰语 (fi)、法语 (fr)、弗里斯兰语 (fy)、加利西亚语 (gl)、格鲁吉亚语 (ka)、德语 (de)、希腊语 (el)、古吉拉特语 (gu)、海地克里奥尔语 (ht)、豪萨语 (ha)、夏威夷语 (haw)、希伯来语 (iw)、印地语 (hi)、苗语 (hmn)、匈牙利语 (hu)、冰岛语 (is)、伊博语 (ig)、印度尼西亚语 (id)、爱尔兰语 (ga)、意大利语 (it)、日语 (ja)、爪哇语 (jv)、卡纳达语 (kn)、哈萨克语 (kk)、高棉语 (km)、韩语 (ko)、库尔德语 (ku)、吉尔吉斯语 (ky)、老挝语 (lo)、拉丁语 (la)、拉脱维亚语 (lv)、立陶宛语 (lt)、卢森堡语 (lb)、马其顿语 (mk)、马达加斯加语 (mg)、马来语 (ms)、马拉雅拉姆语 (ml)、马耳他语 (mt)、毛利语 (mi)、马拉地语 (mr)、蒙古语 (mn)、缅甸语 (my)、尼泊尔语 (ne)、尼扬加语（齐切瓦语）(ny)、挪威语 (no)、普什图语 (ps)、波斯语 (fa)、波兰语 (pl)、葡萄牙语 (pt)、旁遮普语 (pa)、罗马尼亚语 (ro)、俄语 (ru)、萨摩亚语 (sm)、苏格兰盖尔语 (gd)、塞尔维亚语 (sr)、塞索托语 (st)、绍纳语 (sn)、信德语 (sd)、僧伽罗语（锡兰语）(si)、斯洛伐克语 (sk)、斯洛文尼亚语 (sl)、索马里语 (so)、西班牙语 (es)、巽他语 (su)、斯瓦希里语 (sw)、瑞典语 (sv)、塔吉克语 (tg)、泰米尔语 (ta)、泰卢固语 (te)、泰语 (th)、土耳其语 (tr)、乌克兰语 (uk)、乌尔都语 (ur)、乌兹别克语 (uz)、越南语 (vi)、威尔士语 (cy)、科萨语 (xh)、意第绪语 (yi)、约鲁巴语 (yo) 和祖鲁语 (zu)。

Imagen 3

Imagen 3 支持以下语言：

英语 (en)、中文（简体和繁体）(zh)、印地语 (hi)、日语 (ja)、韩语 (ko)、葡萄牙语 (pt) 和西班牙语 (es)。

MedLM

MedLM 模型支持英语 (en)。

在 Model Garden 中探索所有模型

Model Garden 是一个平台，可帮助您发现、测试、自定义和部署 Google 专有的以及部分 OSS 模型和资产。如需探索 Vertex AI 上可用的生成式 AI 模型和 API，请前往 Google Cloud 控制台中的 Model Garden。

转到 Model Garden

如需详细了解 Model Garden，包括可用的模型和功能，请参阅在 Model Garden 中探索 AI 模型。

模型版本

如需查看所有模型版本（包括旧版模型和已弃用的模型），请参阅模型版本和生命周期。

后续步骤

使用 Vertex AI Studio 或 Vertex AI API 尝试学习快速入门教程。
探索 Model Garden 中的预训练模型。
了解如何使用 Model Garden 组织政策控制对 Model Garden 中特定模型的访问权限。
了解价格。