Google 模型

本指南简要介绍了 Vertex AI 上提供的 Google 模型。它涵盖以下模型系列:

  • Gemini 模型:Google 最强大的多模态模型,可用于复杂的推理、聊天和代码生成。
  • Gemma 模型:一系列先进的轻量级开放模型。
  • 嵌入模型:将文本和多模态数据转换为向量表示形式的模型。
  • Imagen 模型:用于图片生成、修改和标注的高级模型。
  • Veo 模型:Google 最新的高质量视频生成模型。
  • MedLM 模型:面向医疗保健行业微调的医学模型。

精选 Gemini 模型

所有 Gemini 模型

型号 说明 状态
Gemini 2.5 Pro Google 迄今为止最先进的推理模型。 GA
Gemini 2.5 Flash 在性价比方面表现出色的模型,可提供全面的功能。 GA
Gemini 2.5 Flash-Lite Google 旗下最具性价比的模型,可支持高吞吐量任务。 预览
Gemini 2.0 Flash 我们最新的多模态模型,具有新一代功能和更强大的能力。 GA
Gemini 2.0 Flash-Lite 经过优化,提高了成本效益并缩短了延迟时间的 Gemini 2.0 Flash 模型。 GA

Gemma 模型

Gemma 是一系列先进的轻量级开放式模型,其开发采用了与 Gemini 模型相同的研究成果和技术。

型号 说明
Gemma 3 Google 最新的 Gemma 开放模型,能够通过文本和图片输入解决各种任务,支持 140 多种语言,并提供长达 128K 的上下文窗口。
Gemma 2 第二代开放模型,支持文本生成、总结和提取。
Gemma 一种小型、轻量级的开放式模型,支持文本生成、总结和提取。
ShieldGemma 2 经过指令调优的模型,用于根据一组已定义的安全政策评估文本和图片的安全程度。
PaliGemma 我们的开放式视觉语言模型,结合了 SigLIP 和 Gemma。
CodeGemma 功能强大的轻量级开放模型,可以执行各种编码任务,例如填充中间代码完成、代码生成、自然语言理解、数学推理和指令遵循。
TxGemma 根据治疗相关数据生成预测、分类或文本,可用于高效构建 AI 模型,以执行治疗相关任务,且所需数据和计算资源更少。

嵌入模型

型号 说明
Embeddings for Text 将文本数据转换为向量表示法,以用于语义搜索、分类、聚类和类似任务。
多模态嵌入 基于图片生成向量,这些向量可用于图片分类、图片搜索等下游任务。

Imagen 模型

型号 说明 状态
Imagen 3 for Generation 使用文本提示生成新图片。 GA
Imagen 3 for Editing and Customization 使用文本提示修改现有输入图片或图片的某些部分(使用遮罩),或根据输入参考图片提供的上下文生成新图片。 GA
Imagen 3 for Fast Generation 使用文字提示生成新图片,延迟时间比我们的其他图片生成模型更短。 GA
Imagen for Captioning & VQA 使用文本提示生成新图片、修改现有图片、使用遮罩修改图片的部分内容等。 GA
Imagen 4 for Generation 使用文本提示生成比我们之前的图片生成模型质量更高的新颖图片。 预览
Imagen 4 for Fast Generation 使用文本提示生成新颖的图片,与我们之前的图片生成模型相比,质量更高,延迟时间更短。 预览
Imagen 4 for Ultra Generation 使用文字提示生成新颖的图片,与我们之前的图片生成模型相比,生成的图片质量更高,提示遵循度也更好。 预览

Veo 模型

型号 说明 状态
Veo 2 for Generation 使用文字提示和图片生成新视频。 GA
Veo 3 for Generation 使用文字提示和图片生成新颖的视频,质量比我们之前的视频生成模型更高。 预览
Veo 3 Fast for Generation 使用文字提示和图片生成新颖的视频,与我们之前的视频生成模型相比,生成的视频质量更高,延迟时间更短。 预览

MedLM 模型

型号 说明
MedLM-medium 一组符合健康保险流通与责任法案 (HIPAA) 要求的医学调优模型,旨在帮助医疗保健从业者进行医学类问答任务,以及对医疗保健和医学文档进行摘要。
MedLM-large-large 一组符合健康保险流通与责任法案 (HIPAA) 要求的医学调优模型,旨在帮助医疗保健从业者进行医学类问答任务,以及对医疗保健和医学文档进行摘要。

语言支持

Gemini

所有 Gemini 模型都可以理解并以以下语言回答:

南非荷兰语 (af)、 阿尔巴尼亚语 (sq)、 阿姆哈拉语 (am)、 阿拉伯语 (ar)、 亚美尼亚语 (hy)、 阿萨姆语 (as)、 阿塞拜疆语 (az)、 巴斯克语 (eu)、 白俄罗斯语 (be)、 孟加拉语 (bn)、 波斯尼亚语 (bs)、 保加利亚语 (bg)、 加泰罗尼亚语 (ca)、 宿务语 (ceb)、 中文(简体和繁体)(zh)、 科西嘉语 (co)、 克罗地亚语 (hr)、 捷克语 (cs)、 丹麦语 (da)、 迪维希语 (dv)、 荷兰语 (nl)、 英语 (en)、 世界语 (eo)、 爱沙尼亚语 (et)、 菲律宾语(他加禄语)(fil)、 芬兰语 (fi)、 法语 (fr)、 弗里斯兰语 (fy)、 加利西亚语 (gl)、 格鲁吉亚语 (ka)、 德语 (de)、 希腊语 (el)、 古吉拉特语 (gu)、 海地克里奥尔语 (ht)、 豪萨语 (ha)、 夏威夷语 (haw)、 希伯来语 (iw)、 印地语 (hi)、 苗语 (hmn)、 匈牙利语 (hu)、 冰岛语 (is)、 伊博语 (ig)、 印度尼西亚语 (id)、 爱尔兰语 (ga)、 意大利语 (it)、 日语 (ja)、 爪哇语 (jv)、 卡纳达语 (kn)、 哈萨克语 (kk)、 高棉语 (km)、 韩语 (ko)、 克里奥语 (kri)、 库尔德语 (ku)、 吉尔吉斯语 (ky)、 老挝语 (lo)、 拉丁语 (la)、 拉脱维亚语 (lv)、 立陶宛语 (lt)、 卢森堡语 (lb)、 马其顿语 (mk)、 马达加斯加语 (mg)、 马来语 (ms)、 马拉雅拉姆语 (ml)、 马耳他语 (mt)、 毛利语 (mi)、 马拉地语 (mr)、 梅泰语(曼尼普尔语)(mni-Mtei)、 蒙古语 (mn)、 缅甸语 (my)、 尼泊尔语 (ne)、 挪威语 (no)、 尼扬加语(齐切瓦语)(ny)、 奥迪亚语(奥里亚语)(or)、 普什图语 (ps)、 波斯语 (fa)、 波兰语 (pl)、 葡萄牙语 (pt)、 旁遮普语 (pa)、 罗马尼亚语 (ro)、 俄语 (ru)、 萨摩亚语 (sm)、 苏格兰盖尔语 (gd)、 塞尔维亚语 (sr)、 塞索托语 (st)、 绍纳语 (sn)、 信德语 (sd)、 僧伽罗语(锡兰语)(si)、 斯洛伐克语 (sk)、 斯洛文尼亚语 (sl)、 索马里语 (so)、 西班牙语 (es)、 巽他语 (su)、 斯瓦希里语 (sw)、 瑞典语 (sv)、 塔吉克语 (tg)、 泰米尔语 (ta)、 泰卢固语 (te)、 泰语 (th)、 土耳其语 (tr)、 乌克兰语 (uk)、 乌尔都语 (ur)、 维吾尔语 (ug)、 乌兹别克语 (uz)、 越南语 (vi)、 威尔士语 (cy)、 科萨语 (xh)、 意第绪语 (yi)、 约鲁巴语 (yo) 和祖鲁语 (zu)。

Gemma

Gemma 仅支持英语 (en)。

Embeddings

多语言文本嵌入模型支持以下语言:

南非荷兰语 (af)、 阿尔巴尼亚语 (sq)、 阿姆哈拉语 (am)、 阿拉伯语 (ar)、 亚美尼亚语 (hy)、 阿塞拜疆语 (az)、 巴斯克语 (eu)、 白俄罗斯语 (be)、 孟加拉语 (bn)、 保加利亚语 (bg)、 加泰罗尼亚语 (ca)、 宿务语 (ceb)、 中文(简体和繁体)(zh)、 科西嘉语 (co)、 捷克语 (cs)、 丹麦语 (da)、 荷兰语 (nl)、 英语 (en)、 世界语 (eo)、 爱沙尼亚语 (et)、 菲律宾语(他加禄语)(fil)、 芬兰语 (fi)、 法语 (fr)、 弗里斯兰语 (fy)、 加利西亚语 (gl)、 格鲁吉亚语 (ka)、 德语 (de)、 希腊语 (el)、 古吉拉特语 (gu)、 海地克里奥尔语 (ht)、 豪萨语 (ha)、 夏威夷语 (haw)、 希伯来语 (iw)、 印地语 (hi)、 苗语 (hmn)、 匈牙利语 (hu)、 冰岛语 (is)、 伊博语 (ig)、 印度尼西亚语 (id)、 爱尔兰语 (ga)、 意大利语 (it)、 日语 (ja)、 爪哇语 (jv)、 卡纳达语 (kn)、 哈萨克语 (kk)、 高棉语 (km)、 韩语 (ko)、 库尔德语 (ku)、 吉尔吉斯语 (ky)、 老挝语 (lo)、 拉丁语 (la)、 拉脱维亚语 (lv)、 立陶宛语 (lt)、 卢森堡语 (lb)、 马其顿语 (mk)、 马达加斯加语 (mg)、 马来语 (ms)、 马拉雅拉姆语 (ml)、 马耳他语 (mt)、 毛利语 (mi)、 马拉地语 (mr)、 蒙古语 (mn)、 缅甸语 (my)、 尼泊尔语 (ne)、 尼扬加语(齐切瓦语)(ny)、 挪威语 (no)、 普什图语 (ps)、 波斯语 (fa)、 波兰语 (pl)、 葡萄牙语 (pt)、 旁遮普语 (pa)、 罗马尼亚语 (ro)、 俄语 (ru)、 萨摩亚语 (sm)、 苏格兰盖尔语 (gd)、 塞尔维亚语 (sr)、 塞索托语 (st)、 绍纳语 (sn)、 信德语 (sd)、 僧伽罗语(锡兰语)(si)、 斯洛伐克语 (sk)、 斯洛文尼亚语 (sl)、 索马里语 (so)、 西班牙语 (es)、 巽他语 (su)、 斯瓦希里语 (sw)、 瑞典语 (sv)、 塔吉克语 (tg)、 泰米尔语 (ta)、 泰卢固语 (te)、 泰语 (th)、 土耳其语 (tr)、 乌克兰语 (uk)、 乌尔都语 (ur)、 乌兹别克语 (uz)、 越南语 (vi)、 威尔士语 (cy)、 科萨语 (xh)、 意第绪语 (yi)、 约鲁巴语 (yo) 和祖鲁语 (zu)。

Imagen 3

Imagen 3 支持以下语言:

英语 (en)、 中文(简体和繁体)(zh)、 印地语 (hi)、 日语 (ja)、 韩语 (ko)、 葡萄牙语 (pt) 和西班牙语 (es)。

MedLM

MedLM 模型支持英语 (en)。

在 Model Garden 中探索所有模型

Model Garden 是一个平台,可帮助您发现、测试、自定义和部署 Google 专有的以及部分 OSS 模型和资产。如需探索 Vertex AI 上可用的生成式 AI 模型和 API,请前往 Google Cloud 控制台中的 Model Garden。

转到 Model Garden

如需详细了解 Model Garden,包括可用的模型和功能,请参阅在 Model Garden 中探索 AI 模型

模型版本

如需查看所有模型版本(包括旧版模型和已停用的模型),请参阅模型版本和生命周期

后续步骤