Llama 的开源大语言模型 (LLM) 为开发者提供创新所需的透明度和灵活性,实现轻松部署、成本效益和可伸缩性能。在 Vertex AI 上使用 Llama 构建应用,您将前沿开放模型的优势与 Google Cloud 全面 AI 平台所具备的企业级安全性、可扩展性和托管工具相结合。
面向开放访问的 LLM,专为扩缩而设计
Llama 4 Maverick 是一款拥有 170 亿个活跃参数、由 128 个专家训练的多模态模型,在智能、成本与速度之间实现最优平衡。Llama 4 Maverick 具备图片和文本理解能力,可用于构建跨越语言障碍的复杂 AI 应用。Llama 4 模型具备编码、推理和图片处理能力,并采用神经网络的混合专家 (MoE) 架构。
主要应用场景包括语言翻译、多文档摘要和内容创作。它还可作为个人助理、支持教育和学习、协助研究,并对庞大的代码库进行逻辑推理。
Llama 4 Scout:业界领先的原生多模态模型
Llama 4 Scout 是一个强大的多模态 AI 模型,在处理高度复杂任务时表现出色。它能够流畅应对开放式提示和未见场景。
主要应用场景包括多模态助理应用,例如构建支持文本与图片的聊天机器人、调试代码生成任务、处理长上下文内容、多智能体协作流程,以及数据驱动的决策制定。
Llama 3.3 70B:开源 AI 模型
Llama 3.3 70B 是一个纯文本模型,可通过 Vertex AI 平台部署,在处理各类语言任务时具备高度优化的性能和效率,能够为开发者提供轻量级应用,降低使用成本。
主要应用场景包括客户服务、代码生成与调试以及训练数据的部署。
Llama 3.2 90B:轻量级多模态模型
Llama 3.2 90B:一种多模态、高效且灵活的模型,能够理解高分辨率图片。
主要应用场景包括:视觉搜索功能(如电子商务中通过图片查找商品)、医学图像扫描、复杂文档的数据分析、内容生成,以及具备上下文感知能力。
面向开放访问的 LLM,专为扩缩而设计
Llama 4 Maverick 是一款拥有 170 亿个活跃参数、由 128 个专家训练的多模态模型,在智能、成本与速度之间实现最优平衡。Llama 4 Maverick 具备图片和文本理解能力,可用于构建跨越语言障碍的复杂 AI 应用。Llama 4 模型具备编码、推理和图片处理能力,并采用神经网络的混合专家 (MoE) 架构。
主要应用场景包括语言翻译、多文档摘要和内容创作。它还可作为个人助理、支持教育和学习、协助研究,并对庞大的代码库进行逻辑推理。
Llama 4 Scout:业界领先的原生多模态模型
Llama 4 Scout 是一个强大的多模态 AI 模型,在处理高度复杂任务时表现出色。它能够流畅应对开放式提示和未见场景。
主要应用场景包括多模态助理应用,例如构建支持文本与图片的聊天机器人、调试代码生成任务、处理长上下文内容、多智能体协作流程,以及数据驱动的决策制定。
Llama 3.3 70B:开源 AI 模型
Llama 3.3 70B 是一个纯文本模型,可通过 Vertex AI 平台部署,在处理各类语言任务时具备高度优化的性能和效率,能够为开发者提供轻量级应用,降低使用成本。
主要应用场景包括客户服务、代码生成与调试以及训练数据的部署。
Llama 3.2 90B:轻量级多模态模型
Llama 3.2 90B:一种多模态、高效且灵活的模型,能够理解高分辨率图片。
主要应用场景包括:视觉搜索功能(如电子商务中通过图片查找商品)、医学图像扫描、复杂文档的数据分析、内容生成,以及具备上下文感知能力。
利用 Vertex AI 的工具和 Llama 模型的先进功能开发智能体。
利用 Google Cloud 内置安全、隐私保护、数据治理和合规功能,这些功能专为满足企业级标准而设计。
将您的企业数据与 Llama 的先进能力集成,利用 BigQuery 等工具提取有价值的洞见,推动明智的决策制定。
Llama 模型在复杂推理、视觉分析、代码生成和多语言处理方面展现出高级能力。这些模型能够理解复杂指令,并生成细致全面的输出内容。