此页面由 Cloud Translation API 翻译。

适用于 MaaS 的 Vertex AI 托管式模型

Vertex AI 支持一组精选的合作伙伴模型和开放模型作为托管式模型。这些模型可与 Vertex AI 搭配，作为模型即服务 (MaaS) 使用，并作为托管式 API 提供。使用托管式模型时，您可以继续向 Vertex AI 端点发送请求。托管式模型是无服务器服务，因此您无需预配或管理基础设施。

您可以使用 Model Garden 发现托管式模型，还可以使用 Model Garden 部署模型。如需了解详情，请参阅在 Model Garden 中探索 AI 模型。

合作伙伴模型

以下合作伙伴模型在 Vertex AI Model Garden 上以托管式 API 的形式 (MaaS) 提供：

模型名称	模态	说明	快速入门
Claude Sonnet 4.5	语言、视觉	Anthropic 的中型模型，可为实际应用中的智能体提供在编码、计算机使用、网络安全和处理电子表格等办公文件方面的功能。	模型卡片
Claude Opus 4.1	语言、视觉	编码领域的行业领导者。它在需要集中精力并执行数千个步骤的长时间运行任务中可提供持续的性能，从而显著扩展了 AI 智能体的解决能力。非常适合为前沿代理产品和功能提供支持。	模型卡片
Claude Haiku 4.5	语言、视觉	Claude Haiku 4.5 在各种应用场景中都能提供接近前沿的性能，是全球最出色的编码模型之一，能够以合适的速度和成本为免费产品和大批量用户体验提供支持。	模型卡片
Claude Opus 4	语言、视觉	Claude Opus 4 在需要集中精力并执行数千个步骤的长时间运行任务中可提供持续的性能，从而显著扩展了 AI 智能体可以解决的问题范围。	模型卡片
Claude Sonnet 4	语言、视觉	Anthropic 的中型模型，具有出色的智能水平，适合大批量使用，例如编码、深入研究和智能体。	模型卡片
Anthropic 的 Claude 3.7 Sonnet	语言、视觉	业界领先的编码模型，可为 AI 智能体提供支持，是首个提供扩展思考的 Claude 模型。	模型卡片
Anthropic 的 Claude 3.5 Sonnet v2	语言、视觉	升级后的 Claude 3.5 Sonnet 是用于处理实际的软件工程任务和智能体功能的先进模型。Claude 3.5 Sonnet 依靠与其前代产品相同的价格和速度实现了这些进步。	模型卡片
Anthropic 的 Claude 3.5 Haiku	语言、视觉	Claude 3.5 Haiku 是 Anthropic 最快且最具成本效益的新一代模型，非常适合速度和经济性重要的应用场景。	模型卡片
Anthropic 的 Claude 3 Haiku	语言	Anthropic 最快的视觉和文本模型，能够近乎即时地回答基本的查询，旨在打造模仿人类互动的无缝 AI 体验。	模型卡片
Anthropic 的 Claude 3.5 Sonnet	语言	Claude 3.5 Sonnet 凭借 Anthropic 的中端模型 Claude 3 Sonnet 的速度和成本，在 Anthropic 的多种评估中优于 Anthropic 的 Claude 3 Opus。	模型卡片
Jamba 1.5 Large（预览版）	语言	AI21 Labs 的 Jamba 1.5 Large 旨在提供优质的回答、高吞吐量，并且价格与同类别的其他模型相比具有竞争力。	模型卡片
Jamba 1.5 Mini（预览版）	语言	AI21 Labs 的 Jamba 1.5 Mini 在质量、吞吐量和低成本方面取得了良好的平衡。	模型卡片
Mistral Medium 3	语言	Mistral Medium 3 是一款多功能模型，旨在处理各种任务，包括编程、数学推理、理解长文档、总结和对话。	模型卡片
Mistral OCR (25.05)	语言、视觉	Mistral OCR (25.05) 是一款用于文档理解的光学字符识别 API。模型能够理解文档的每个元素，例如媒体、文本、表格和方程式。	模型卡片
Mistral Small 3.1 (25.03)	语言	Mistral Small 3.1 (25.03) 是 Mistral Small 模型的最新版本，具有多模态功能和更长的上下文长度。	模型卡片
Mistral Large (24.11)	语言	Mistral Large (24.11) 是 Mistral Large (24.07) 模型的下一个版本，提高了推理和函数调用功能。	模型卡片
Codestral 2	语言、代码	Codestral 2 是 Mistral 专门为高精度填充中间部分 (FIM) 补全而构建的代码生成专用模型，可通过共享指令和补全 API 端点帮助开发者编写代码并与之交互。	模型卡片
Codestral (25.01)	代码	一种专为代码生成（包括填充中间代码和代码补全）而设计的先进模型。	模型卡片

开放模型

以下开放模型在 Vertex AI Model Garden 上以托管式 API 的形式 (MaaS) 提供：

模型名称	模态	说明	快速入门
gpt-oss 120B	语言	一个 120B 模型，在推理任务方面表现出色。	模型卡片
gpt-oss 20B	语言	一个 20B 模型，经过优化，可在消费类硬件和边缘硬件上高效部署。	模型卡片
Qwen3-Next-80B Thinking	语言、代码	Qwen3-Next 系列模型中的一种，专门用于解决复杂问题和进行深度推理。	模型卡片
Qwen3-Next-80B Instruct	语言、代码	Qwen3-Next 系列模型中的一种，专门用于遵循特定命令。	模型卡片
Qwen3 Coder	语言、代码	一款专为高级软件开发任务而开发的开放权重模型。	模型卡片
Qwen3 235B	语言	一款开放权重模型，具有“混合思维”能力，可在有条理的推理和快速对话之间切换。	模型卡片
DeepSeek-V3.1	语言	DeepSeek 的混合模型，可同时支持思考模式和非思考模式。	模型卡片
DeepSeek R1 (0528)	语言	DeepSeek 最新版本的 DeepSeek R1 模型。	模型卡片
Llama 4 Maverick 17B-128E	语言、视觉	最大、最强大的 Llama 4 模型，具有编码、推理和图像功能。Llama 4 Maverick 17B-128E 是一种使用混合专家 (MoE) 架构和早期融合技术的多模态模型。	模型卡片
Llama 4 Scout 17B-16E	语言、视觉	Llama 4 Scout 17B-16E 在同类模型中取得了出色的结果，在多项基准测试中超越了之前的 Llama 模型以及其他开放模型和专有模型。Llama 4 Scout 17B-16E 是一种使用混合专家 (MoE) 架构和早期融合技术的多模态模型。	模型卡片
Llama 3.3	语言	Llama 3.3 是纯文本 70B 指令调优模型，用于纯文本应用时，相对于 Llama 3.1 70B 和 Llama 3.2 90B，可提供增强的性能。此外，对于某些应用，Llama 3.3 70B 的性能接近 Llama 3.1 405B。	模型卡片
Llama 3.2（预览版）	语言、视觉	中型 90B 多模态模型，可支持图片推理，例如图表和图形分析以及图片标注。	模型卡片
Llama 3.1	语言	一组针对多语言对话应用场景优化的多语言 LLM，在常见的行业基准中优于许多可用的开源和封闭式聊天模型。 Llama 3.1 405B 已正式发布 (GA)。 Llama 3.1 8B 和 Llama 3.1 70B 目前为预览版。	模型卡片

后续步骤

详细了解 MaaS 的 Vertex AI 开放模型。
了解如何调用开放模型 API。