在 Google Cloud Vertex AI 上使用 Llama 模型

在 Vertex AI 部署科技公司 Meta 的 Llama 模型,建構可用於正式環境的 AI 代理和應用程式。Llama 提供多種模型大小和功能,您可以根據特定用途選擇合適的模型,包括輕量級高效模型和多模態版本。這些模型可做為無伺服器 API 使用,並具備原生多模態和多語言功能,提供高效率的文字和影像智慧。

Vertex AI 和 Llama 文字標誌,中間有一個羊駝卡通圖案
Llama 模型總覽

Llama 的開放原始碼大型語言模型 (LLM) 為開發人員提供創新所需的透明度和彈性,可輕鬆部署、符合成本效益,並具備可擴充的效能。在 Vertex AI 中使用 Llama 建構內容,結合最先進開放式模型的優勢,以及 Google Cloud 全方位 AI 平台的企業級安全機制、擴充性和代管工具。

可公開存取的 LLM,專為擴充性而打造

Llama 4 Maverick 擁有 170 億個現用參數,是經過 128 位專家訓練的多模態模型,在智慧、成本和速度之間取得最佳平衡。Llama 4 Maverick 可理解圖像和文字,因此能打造出精密的 AI 應用程式,消除語言隔閡。Llama 4 模型提供程式設計、推論和圖像功能,並採用類神經網路的混合專家 (MoE) 架構。

常見用途包括語言翻譯、多份文件摘要和內容創作。此外,還提供個人化協助、支援教育和學習、輔助研究,以及分析龐大的程式碼集。


可公開存取的 LLM,專為擴充性而打造

Llama 4 Maverick 擁有 170 億個現用參數,是經過 128 位專家訓練的多模態模型,在智慧、成本和速度之間取得最佳平衡。Llama 4 Maverick 可理解圖像和文字,因此能打造出精密的 AI 應用程式,消除語言隔閡。Llama 4 模型提供程式設計、推論和圖像功能,並採用類神經網路的混合專家 (MoE) 架構。

常見用途包括語言翻譯、多份文件摘要和內容創作。此外,還提供個人化協助、支援教育和學習、輔助研究,以及分析龐大的程式碼集。


Llama 4 Scout:同級模型中首屈一指的原生多模態模型

Llama 4 Scout 是功能強大的多模態 AI 模型,能夠在執行複雜度高的工作時展現絕佳成效。這個模型具備流暢的理解能力,可掌握開放式提示詞與不可視情境。

常見用途包括建構多模態助理應用程式,例如使用文字和圖片打造聊天機器人、偵錯程式碼生成工作、長脈絡應用程式、多代理工作流程,以及根據資料制定決策。


Llama 3.3 70B:開放原始碼 AI 模型

Llama 3.3 70B 是純文字模型,可透過 Vertex AI 平台部署,並經過高度最佳化,能以高效能和高效率處理各種語言相關工作,為開發人員提供輕量級應用程式,進而降低成本。

常見用途包括部署於客戶服務、生成程式碼和偵錯,以及訓練資料。


Llama 3.2 90B:輕量級多模態模型

Llama 3.2 90B:多模態、高效率且彈性的模型,可理解高解析度圖像。

常見用途包括:影像搜尋功能 (讓使用者透過圖片尋找產品,例如電子商務、醫療掃描檔案)、複雜文件資料分析、內容生成,以及情境感知。


在 Vertex AI 使用 Llama 模型的優點和功能

加快 AI 開發速度

Vertex AI 提供整合式環境,方便您大規模地快速評估、部署和管理 Llama 輔助應用程式。

獲得最佳成本效益

運用專為 AI 工作負載設計的全代管基礎架構,簡化 Llama 模型的部署與擴充作業,且計費方式彈性,可從專屬端點或即付即用等定價模式中,選擇最適合的方案。

建構精密的 AI 代理

運用 Vertex AI 工具和 Llama 模型的先進功能開發代理。

內建安全防護、法規遵循和資料治理機制

善用 Google Cloud 專門設計的相關內建功能,確保在安全性、隱私權、資料治理和法規遵循方面符合企業標準。


充分發揮資料的效益

整合企業資料與 Llama 的進階功能,運用 BigQuery 等工具擷取有價值的洞察資訊,據此做出明智決策。

經過強化的功能

Llama 模型具備進階的複雜推論、影像分析、程式碼生成和多語言處理功能。這些模型不僅能按照複雜的指令執行操作,還可生成精細而全面的內容。

在 Vertex AI 使用 Llama 建構內容