Llama 是 Meta 開發的一系列開放模型,您可以在 Vertex AI 上微調及部署這些模型。Llama 提供預先訓練和指令微調的生成式文字與多模態模型。 本文說明 Vertex AI 提供的 Llama 模型,包括: 為協助您根據用途選擇 Llama 模型,下表比較了可用的模型系列。 Llama 4 系列模型是一組多模態模型,採用混合專家 (MoE) 架構。MoE 架構可讓參數數量龐大的模型,只針對任何指定輸入啟用部分參數,進而提高推論效率。此外,Llama 4 使用早期融合技術,整合初始處理階段的文字和視覺資訊。這項方法可協助 Llama 4 模型進一步瞭解文字和圖片之間的複雜關係。Vertex AI 的 Model Garden 提供兩種 Llama 4 模型:Llama 4 Scout 和 Llama 4 Maverick。 詳情請參閱 Model Garden 中的 Llama 4 模型資訊卡,或參閱「在 Vertex AI 上使用 Llama 4 簡介」網誌文章。 Llama 4 Maverick 是最大且最強大的 Llama 4 模型,在程式設計、推理和圖像基準方面表現出色。這個模型擁有 170 億個現用參數,總參數則有 4,000 億個,並由 128 位專家訓練。Llama 4 Maverick 使用交替的密集層和 MoE 層,其中每個權杖會啟動共用專家,以及 128 位路由專家之一。您可以將模型做為預先訓練 (PT) 模型或指令調整 (IT) 模型使用,並支援 FP8。這個模型已預先訓練 200 種語言,並透過精細的後訓練管道進行最佳化,可提供高品質的對話互動。 Llama 4 Maverick 是多模態模型,脈絡長度達 100 萬個詞元。這項技術適用於需要進階智慧和圖像理解的用途,例如: Llama 4 Scout 在同級模型中表現優異,與前幾代 Llama 和其他開放及專有模型相比,Llama 3 在多項基準測試中表現優異,且脈絡窗口支援 1, 000 萬個詞元。這款模型共有 1,090 億個參數,其中 170 億個為現用參數,並有 16 位專家參與訓練,可做為預先訓練 (PT) 模型或指令調整 (IT) 模型使用。 Llama 4 Scout 適合需要對大量資訊進行推理的工作,例如: Llama 3.3 是 700 億參數的純文字模型,經過指令微調。與 Llama 3.1 70B 和 Llama 3.2 90B 相比,這款模型可提升純文字應用程式的效能。在某些應用程式中,Llama 3.3 70B 的效能接近 Llama 3.1 405B。 詳情請參閱 Model Garden 中的 Llama 3.3 模型資訊卡。 Llama 3.2 模型可協助您建構及部署生成式 AI 應用程式,並運用 Llama 的功能 (例如圖像推理) 打造各種功能。Llama 3.2 也適用於裝置端應用程式。 Llama 3.2 的主要功能包括: 1B 和 3B 模型是輕量型純文字模型,支援裝置端使用案例,例如多語言本機知識檢索、摘要和重寫。 11B 和 90B 模型是小型和中型多模態模型,具備圖像推理能力。例如,分析圖表中的視覺資料,提供更準確的回覆,以及從圖片中擷取詳細資料,生成文字說明。 詳情請參閱 Model Garden 中的 Llama 3.2 模型資訊卡。 使用 11B 和 90B 模型時,純文字提示不受限制。不過,如果提示中包含圖片,圖片必須位於提示開頭,且只能包含一張圖片。舉例來說,您無法同時加入文字和圖片。 Llama 3.1 模型系列是一組預先訓練的多語言生成式文字模型,經過指令微調,提供 8B、70B 和 405B 大小。Llama 3.1 指令微調模型經過最佳化,適用於多語言對話應用情境,與許多市售的開放原始碼和專有即時通訊模型相比,在常見的業界基準上表現優異。 詳情請參閱 Model Garden 中的 Llama 3.1 模型資訊卡。 Llama 3 指令調整模型是一系列針對對話用途最佳化的大型語言模型。與許多可用的開放原始碼聊天模型相比,Llama 3 模型在常見的業界基準上表現優異。 詳情請參閱 Model Garden 中的 Llama 3 模型資訊卡。 Llama 2 LLM 是一系列預先訓練和微調的生成式文字模型,大小從 70 億到 700 億個參數不等。 詳情請參閱 Model Garden 中的 Llama 2 模型資訊卡。 Meta 的 Code Llama 模型專為程式碼合成、理解和指令而設計。 詳情請參閱 Model Garden 中的 Code Llama 模型資訊卡。 Llama Guard 3 以 Llama Guard 2 的功能為基礎,新增了三種類別:誹謗、選舉和濫用程式碼解譯器。此外,這個模型支援多種語言,提示格式也與 Llama 3 或更新版本的指令模型一致。 詳情請參閱 Model Garden 中的 Llama Guard 模型資訊卡。 如要進一步瞭解 Model Garden,請參閱「探索 Model Garden 中的 AI 模型」。
型號系列
說明
主要用途
Llama 4
採用混合專家 (MoE) 架構的多模態模型 (文字、圖片)。包括 Scout (長脈絡) 和 Maverick (最高功能)。
進階圖像分析、視覺問答、生成創意文字,以及對大型文件或程式碼集進行推理。
Llama 3.3
700 億個參數的純文字模型,經過指令調整,可提升文字應用程式的效能。
高效能的純文字工作,可達到遠大於自身規模的模型效能。
Llama 3.2
專為各種應用程式設計的高效率多模態模型 (文字、圖片),包括裝置端用途。
圖像推理、圖表分析、裝置端摘要和多語言知識檢索。
Llama 3.1
多語言純文字模型 (80 億、700 億、4,050 億),專為對話最佳化。
多語言對話和即時通訊應用程式。
Llama 3
經過指令調整的純文字模型,適合用於對話。
一般對話和即時通訊應用程式。
Llama 2
一系列預先訓練和微調的生成式文字模型 (7B 至 70B)。
一般用途的生成式文字工作。
Code Llama
以 Llama 2 為基礎的文字轉程式碼模型。
生成、完成及偵錯程式碼。
Llama Guard 3
安全模型:根據風險分類法分類內容。支援多種語言,且功能比舊版更強大。
內容審核,以及為生成式 AI 應用程式導入安全層。
Llama 4
Llama 4 Maverick
Llama 4 Scout
Llama 3.3
Llama 3.2
注意事項
Llama 3.1
Llama 3
Llama 2
Code Llama
Llama Guard 3
資源
自行部署的 Llama 模型
除非另有註明,否則本頁面中的內容是採用創用 CC 姓名標示 4.0 授權,程式碼範例則為阿帕契 2.0 授權。詳情請參閱《Google Developers 網站政策》。Java 是 Oracle 和/或其關聯企業的註冊商標。
上次更新時間:2025-08-19 (世界標準時間)。