Modelos Llama na Vertex AI do Google Cloud 

Implante modelos Llama (da empresa de tecnologia Meta) na Vertex AI para criar agentes e aplicativos de IA prontos para produção. Com uma variedade de tamanhos e recursos de modelos, você pode escolher o modelo Llama certo para seu caso de uso específico, desde modelos leves e eficientes até versões multimodais. Acesse esses modelos como APIs sem servidor e aproveite os recursos multimodais e multilíngues nativos para ter inteligência visual e de texto altamente eficiente.

Logotipo da Vertex AI e do Llama com uma lhama de desenho animado entre eles
Visão geral dos modelos Llama

Os modelos de linguagem grandes (LLMs) de código aberto do Llama oferecem aos desenvolvedores a transparência e a flexibilidade necessárias para a inovação, permitindo fácil implantação, economia e desempenho escalonável. Ao criar com o Llama na Vertex AI, você combina as vantagens de modelos abertos de ponta com a segurança, escalonabilidade e ferramentas gerenciadas de nível empresarial da plataforma de IA abrangente do Google Cloud.

LLMs de acesso aberto, criados para escalonar

O Llama 4 Maverick, com 17 bilhões de parâmetros ativos, é um modelo multimodal treinado por 128 especialistas, oferecendo um equilíbrio ideal entre inteligência, custo e velocidade. O Llama 4 Maverick oferece compreensão de imagens e textos, permitindo a criação de aplicativos de IA sofisticados que superam barreiras linguísticas. Os modelos Llama 4 oferecem recursos de programação, raciocínio e imagem, além de apresentar uma arquitetura de rede neural de mistura de especialistas (MoE).

Os principais casos de uso incluem tradução de idiomas, resumo de vários documentos e criação de conteúdo. Ele também pode fornecer assistência pessoal, apoiar a educação e o aprendizado, ajudar na pesquisa e raciocinar sobre grandes bases de código.


LLMs de acesso aberto, criados para escalonar

O Llama 4 Maverick, com 17 bilhões de parâmetros ativos, é um modelo multimodal treinado por 128 especialistas, oferecendo um equilíbrio ideal entre inteligência, custo e velocidade. O Llama 4 Maverick oferece compreensão de imagens e textos, permitindo a criação de aplicativos de IA sofisticados que superam barreiras linguísticas. Os modelos Llama 4 oferecem recursos de programação, raciocínio e imagem, além de apresentar uma arquitetura de rede neural de mistura de especialistas (MoE).

Os principais casos de uso incluem tradução de idiomas, resumo de vários documentos e criação de conteúdo. Ele também pode fornecer assistência pessoal, apoiar a educação e o aprendizado, ajudar na pesquisa e raciocinar sobre grandes bases de código.


Llama 4 Scout: um modelo multimodal nativo líder de mercado

O Llama 4 Scout é um modelo de IA multimodal poderoso, com bom desempenho em tarefas altamente complexas. Ele é capaz de lidar com comandos abertos e cenários não vistos com fluência.

Os principais casos de uso incluem apps de assistente multimodal, como a criação de chatbots com texto e imagens, a depuração de tarefas de geração de código, aplicativos de contexto longo, fluxos de trabalho multiagente e tomada de decisões orientada por dados.


Llama 3.3 70B: modelo de IA de código aberto

O Llama 3.3 70B é um modelo somente de texto que pode ser implantado pela plataforma Vertex AI e é altamente otimizado para desempenho e eficiência no tratamento de uma ampla variedade de tarefas baseadas em linguagem, oferecendo aos desenvolvedores um aplicativo leve que reduz os custos.

Os principais casos de uso incluem implantação no atendimento ao cliente, geração e depuração de código e dados de treinamento.


Llama 3.2 90B: um modelo multimodal leve

Llama 3.2 90B: um modelo multimodal, eficiente e flexível que entende imagens de alta resolução.

Os principais casos de uso incluem a funcionalidade de pesquisa visual, que permite aos usuários encontrar produtos usando imagens, como e-commerce, exames médicos, análise de dados para documentos complexos, geração de conteúdo e reconhecimento de contexto.


Benefícios e recursos dos modelos Llama na Vertex AI

Acelere o desenvolvimento de IA

A Vertex AI oferece um ambiente integrado para avaliar, implantar e gerenciar aplicativos com tecnologia Llama de forma rápida e em grande escala.

Otimize o desempenho e o custo

Simplifique a implantação e a escalonabilidade de modelos Llama com uma infraestrutura totalmente gerenciada projetada para cargas de trabalho de IA e a opção de escolher modelos de preços flexíveis, como endpoints dedicados ou preço de pagamento por uso.

Criar agentes de IA sofisticados

Desenvolva agentes com as ferramentas da Vertex AI e os recursos avançados dos modelos Llama.

Segurança, compliance e governança de dados integradas

Aproveite os recursos integrados de segurança, privacidade, governança de dados e compliance do Google Cloud, personalizados para aderir aos padrões de nível empresarial.


Maximize o potencial dos seus dados

Integre perfeitamente os dados da sua empresa aos recursos avançados do Llama, usando ferramentas como o BigQuery para extrair insights valiosos e tomar decisões fundamentadas.

Recursos avançados

Os modelos Llama demonstram habilidades avançadas em raciocínio complexo, análise de visão, geração de código e processamento multilíngue. Esses modelos podem seguir instruções complexas e gerar resultados abrangentes e sutis.

Crie com o Llama na Vertex AI


Google Cloud