Google Cloud Vertex AI 上的 Llama 模型

在 Vertex AI 上部署 Llama 模型(由科技公司 Meta 推出),构建可投入生产使用的 AI 智能体和应用。Llama 模型具备多种规模和功能,您可以根据具体应用场景选择合适的模型,从轻量高效型到多模态版本,应有尽有。通过无服务器 API 访问这些模型,利用其原生的多模态和多语言能力,实现高效的文本与视觉智能处理。

Vertex AI 与 Llama 的文字徽标,中间是一只卡通羊驼
Llama 模型概览

Llama 的开源大语言模型 (LLM) 为开发者提供创新所需的透明度和灵活性,实现轻松部署、成本效益和可伸缩性能。在 Vertex AI 上使用 Llama 构建应用,您将前沿开放模型的优势与 Google Cloud 全面 AI 平台所具备的企业级安全性、可扩展性和托管工具相结合。

面向开放访问的 LLM,专为扩缩而设计

Llama 4 Maverick 是一款拥有 170 亿个活跃参数、由 128 个专家训练的多模态模型,在智能、成本与速度之间实现最优平衡。Llama 4 Maverick 具备图片和文本理解能力,可用于构建跨越语言障碍的复杂 AI 应用。Llama 4 模型具备编码、推理和图片处理能力,并采用神经网络的混合专家 (MoE) 架构。

主要应用场景包括语言翻译、多文档摘要和内容创作。它还可作为个人助理、支持教育和学习、协助研究,并对庞大的代码库进行逻辑推理。


面向开放访问的 LLM,专为扩缩而设计

Llama 4 Maverick 是一款拥有 170 亿个活跃参数、由 128 个专家训练的多模态模型,在智能、成本与速度之间实现最优平衡。Llama 4 Maverick 具备图片和文本理解能力,可用于构建跨越语言障碍的复杂 AI 应用。Llama 4 模型具备编码、推理和图片处理能力,并采用神经网络的混合专家 (MoE) 架构。

主要应用场景包括语言翻译、多文档摘要和内容创作。它还可作为个人助理、支持教育和学习、协助研究,并对庞大的代码库进行逻辑推理。


Llama 4 Scout:业界领先的原生多模态模型

Llama 4 Scout 是一个强大的多模态 AI 模型,在处理高度复杂任务时表现出色。它能够流畅应对开放式提示和未见场景。

主要应用场景包括多模态助理应用,例如构建支持文本与图片的聊天机器人、调试代码生成任务、处理长上下文内容、多智能体协作流程,以及数据驱动的决策制定。


Llama 3.3 70B:开源 AI 模型

Llama 3.3 70B 是一个纯文本模型,可通过 Vertex AI 平台部署,在处理各类语言任务时具备高度优化的性能和效率,能够为开发者提供轻量级应用,降低使用成本。

主要应用场景包括客户服务、代码生成与调试以及训练数据的部署。


Llama 3.2 90B:轻量级多模态模型

Llama 3.2 90B:一种多模态、高效且灵活的模型,能够理解高分辨率图片。

主要应用场景包括:视觉搜索功能(如电子商务中通过图片查找商品)、医学图像扫描、复杂文档的数据分析、内容生成,以及具备上下文感知能力。


Llama 模型在 Vertex AI 上的优势和功能

加速 AI 开发

Vertex AI 提供集成环境,可快速、大规模地评估、部署和管理由 Llama 驱动的应用。

优化性能和费用

借助专为 AI 工作负载设计的全托管式基础设施,并可选择专用端点或按需计费等灵活的定价模式,简化 Llama 模型的部署与扩缩流程。

构建先进的 AI 智能体

利用 Vertex AI 的工具和 Llama 模型的先进功能开发智能体。

内置安全机制、合规性和数据治理功能

利用 Google Cloud 内置安全、隐私保护、数据治理和合规功能,这些功能专为满足企业级标准而设计。


充分发挥数据的作用

将您的企业数据与 Llama 的先进能力集成,利用 BigQuery 等工具提取有价值的洞见,推动明智的决策制定。

增强的功能

Llama 模型在复杂推理、视觉分析、代码生成和多语言处理方面展现出高级能力。这些模型能够理解复杂指令,并生成细致全面的输出内容。

在 Vertex AI 上使用 Llama 构建