Vertex AI 支援精選的合作夥伴和開放原始碼模型,並以代管模型的形式提供。這些模型可搭配 Vertex AI 做為模型即服務 (MaaS) 使用,並以代管 API 形式提供。使用受管理模型時,您會繼續將要求傳送至 Vertex AI 端點。代管模型是無伺服器模型,因此不需要佈建或管理基礎架構。
您可以使用 Model Garden 探索受管理模型。您也可以使用 Model Garden 部署模型。詳情請參閱「探索 Model Garden 中的 AI 模型」。
合作夥伴模型
下列合作夥伴模型在 Vertex AI Model Garden (MaaS) 中以代管 API 形式提供:
模型名稱 | 模態 | 說明 | 快速入門導覽課程 |
---|---|---|---|
Claude Sonnet 4.5 | 語言、視覺 | Anthropic 的中型模型,可支援實際的代理程式,並具備程式設計、電腦使用、網路安全,以及處理試算表等 Office 檔案的能力。 | Model Card |
Claude Opus 4.1 | 語言、視覺 | 程式設計領域的領導者。對於需要專注投入大量心力、執行數千個步驟的長期任務,這項技術可持續提供優異成效,大幅擴展 AI 代理程式可解決的問題。非常適合為前沿代理程式產品和功能提供動力。 | Model Card |
Claude Haiku 4.5 | 語言、視覺 | Claude Haiku 4.5 適用於各種用途,效能接近尖端模型,而且是全球頂尖的程式碼模型之一,速度和成本都恰到好處,可為免費產品和大量使用者體驗提供支援。 | Model Card |
Claude Opus 4 | 語言、視覺 | Claude Opus 4 在需要專注投入大量心力,並經過數千個步驟的長時間執行工作方面,能持續展現出色成效,大幅擴展 AI 代理程式可解決的問題。 | Model Card |
Claude Sonnet 4 | 語言、視覺 | Anthropic 的中型模型,具備卓越的智慧,適用於高用量的程式設計、深入研究和代理等用途。 | Model Card |
Anthropic 的 Claude 3.7 Sonnet | 語言、視覺 | 業界領先的程式設計模型,可為 AI 代理提供支援,也是第一個可以廣泛思考的 Claude 模型。 | Model Card |
Anthropic 的 Claude 3.5 Sonnet v2 | 語言、視覺 | 全新升級的 Claude 3.5 Sonnet 是最先進的模型,能實際處理軟體工程任務,以及建構虛擬服務專員功能。新版 Claude 3.5 Sonnet 的功能取得了顯著進展,而價格和速度表現卻維持不變。 | Model Card |
Anthropic 的 Claude 3.5 Haiku | 語言、視覺 | Claude 3.5 Haiku 是 Anthropic 新一代速度最快且最具成本效益的模型,是追求速度表現和性價比的最佳選擇。 | Model Card |
Anthropic 的 Claude 3 Haiku | 語言 | Anthropic 最快速的視覺與文字模型,能夠近乎即時地回覆基本查詢,讓使用者享有與真人互動相似的流暢 AI 體驗。 | Model Card |
Anthropic 的 Claude 3.5 Sonnet | 語言 | 在 Anthropic 進行的一系列評測中,Claude 3.5 Sonnet 的表現皆優於 Anthropic 的 Claude 3 Opus,而速度與成本方面的表現則等同於 Anthropic 的中階模型 Claude 3 Sonnet。 | Model Card |
Jamba 1.5 Large (預先發布版) | 語言 | AI21 Labs 的 Jamba 1.5 Large 旨在提供優質回覆、高輸送量,以及相較於同類大小的其他模型更具競爭力的價格。 | Model Card |
Jamba 1.5 Mini (預先發布版) | 語言 | AI21 Labs 的 Jamba 1.5 Mini 在品質、輸送量和低成本之間取得良好平衡。 | Model Card |
Mistral Medium 3 | 語言 | Mistral Medium 3 是多功能模型,適用於各種工作,包括程式設計、數學推理、解讀長篇文件、摘要和對話。 | Model Card |
Mistral OCR (25.05) | 語言、視覺 | Mistral OCR (25.05) 是光學字元辨識 API,可協助理解文件。模型會理解文件中的每個元素,例如媒體、文字、表格和方程式。 | Model Card |
Mistral Small 3.1 (25.03) | 語言 | Mistral Small 3.1 (25.03) 是 Mistral Small 模型的最新版本,具備多模態功能和更長的脈絡長度。 | Model Card |
Mistral Large (24.11) | 語言 | Mistral Large (24.11) 是 Mistral Large (24.07) 模型的下一個版本,現在具備更強大的推論和函式呼叫功能。 | Model Card |
Codestral 2 | 語言、代碼 | Codestral 2 是 Mistral 的程式碼生成專用模型,專為高精確度的填空 (FIM) 補全功能而建構,可透過共用的指令和補全 API 端點,協助開發人員編寫程式碼及與程式碼互動。 | Model Card |
Codestral (25.01) | 程式碼 | 專為程式碼生成設計的先進模型,包括填空和程式碼完成。 | Model Card |
開放式模型
Vertex AI Model Garden (MaaS) 提供下列開放式模型做為代管 API:
模型名稱 | 模態 | 說明 | 快速入門導覽課程 |
---|---|---|---|
gpt-oss 120B | 語言 | 120B 模型,在推理工作方面表現出色。 | Model Card |
gpt-oss 20B | 語言 | 這個 200 億參數模型經過最佳化,可在消費型和邊緣硬體上有效率地部署及執行。 | Model Card |
Qwen3-Next-80B Thinking | 語言、代碼 | Qwen3-Next 系列模型之一,專門用於解決複雜問題和深入推理。 | Model Card |
Qwen3-Next-80B Instruct | 語言、代碼 | Qwen3-Next 系列模型,專門用於執行特定指令。 | Model Card |
Qwen3 Coder | 語言、代碼 | 專為進階軟體開發工作設計的開放權重模型。 | Model Card |
Qwen3 235B | 語言 | 這項開放權重的模型具備「混合思考」能力,可在有條理的推理和快速對話之間切換。 | Model Card |
DeepSeek-V3.1 | 語言 | DeepSeek 的混合式模型,支援思考模式和非思考模式。 | Model Card |
DeepSeek R1 (0528) | 語言 | DeepSeek 最新版的 DeepSeek R1 模型。 | Model Card |
Llama 4 Maverick 17B-128E | 語言、視覺 | 這是最大且最強大的 Llama 4 模型,具備程式設計、推論和圖像功能。Llama 4 Maverick 17B-128E 是多模態模型,採用混合專家 (MoE) 架構和早期融合技術。 | Model Card |
Llama 4 Scout 17B-16E | 語言、視覺 | Llama 4 Scout 17B-16E 在同級模型中表現優異,在多項基準測試中,都優於前幾代 Llama 模型,以及其他開放原始碼和專有模型。Llama 4 Scout 17B-16E 是多模態模型,採用混合專家 (MoE) 架構和早期融合技術。 | Model Card |
Llama 3.3 | 語言 | Llama 3.3 是純文字 70B 指令微調模型,用於純文字應用程式時,效能比 Llama 3.1 70B 和 Llama 3.2 90B 更強大。此外,在某些應用程式中,Llama 3.3 70B 的效能已接近 Llama 3.1 405B。 | Model Card |
Llama 3.2 (預覽版) | 語言、視覺 | 中型 90B 多模態模型,可支援圖像推理,例如圖表分析和圖像說明。 | Model Card |
Llama 3.1 | 語言 |
這是一系列經過最佳化調整的多語言 LLM,適用於多語言對話用途,在常見的業界基準中,表現優於許多現有的開放原始碼和封閉式對話模型。 Llama 3.1 405B 現已正式發布 (GA)。 Llama 3.1 8B 和 Llama 3.1 70B 均為預先發布版。 |
Model Card |
後續步驟
- 進一步瞭解 Vertex AI 開放模型,適用於 MaaS。
- 瞭解如何呼叫開放模型 API。