Modelos geridos da Vertex AI para MaaS

O Vertex AI suporta uma lista organizada de modelos abertos e de parceiros como modelos geridos. Estes modelos podem ser usados com a Vertex AI como um modelo como serviço (MaaS) e são oferecidos como uma API gerida. Quando usa um modelo gerido, continua a enviar os seus pedidos para os pontos finais da Vertex AI. Os modelos geridos são sem servidor, pelo que não é necessário aprovisionar nem gerir a infraestrutura.

Pode descobrir modelos geridos através do Model Garden. Também pode implementar modelos através do Model Garden. Para mais informações, consulte o artigo Explore modelos de IA no Model Garden.

Modelos de parceiros

Os seguintes modelos de parceiros são oferecidos como APIs geridas no Vertex AI Model Garden (MaaS):

Nome do modelo Modalidade Descrição Início rápido
Claude Sonnet 4.5 Idioma, visão O modelo de tamanho médio da Anthropic para potenciar agentes do mundo real, com capacidades em programação, utilização de computadores, cibersegurança e trabalho com ficheiros do Office, como folhas de cálculo. Cartão do modelo
Claude Opus 4.1 Idioma, visão Um líder da indústria na programação. Oferece um desempenho sustentado em tarefas de longa duração que requerem um esforço concentrado e milhares de passos, expandindo significativamente o que os agentes de IA podem resolver. Ideal para potenciar produtos de agentes de vanguarda e funcionalidades. Cartão do modelo
Claude Haiku 4.5 Idioma, visão O Claude Haiku 4.5 oferece um desempenho quase de ponta para uma vasta gama de exemplos de utilização e destaca-se como um dos melhores modelos de programação do mundo, com a velocidade e o custo certos para potenciar produtos gratuitos e experiências do utilizador de grande volume. Cartão do modelo
Claude Opus 4 Idioma, visão O Claude Opus 4 oferece um desempenho sustentado em tarefas de longa duração que requerem um esforço focado e milhares de passos, expandindo significativamente o que os agentes de IA podem resolver. Cartão do modelo
Claude Sonnet 4 Idioma, visão Modelo de tamanho médio da Anthropic com inteligência superior para utilizações de grande volume, como programação, investigação detalhada e agentes. Cartão do modelo
Claude 3.7 Sonnet da Anthropic Idioma, visão Modelo líder da indústria para programação e tecnologia de agentes de IA, e o primeiro modelo Claude a oferecer um raciocínio alargado. Cartão do modelo
Claude 3.5 Sonnet v2 da Anthropic Idioma, visão O Claude 3.5 Sonnet atualizado é um modelo de vanguarda para tarefas de engenharia de software do mundo real e capacidades de agente. O Claude 3.5 Sonnet oferece estes avanços ao mesmo preço e velocidade que o seu antecessor. Cartão do modelo
Claude 3.5 Haiku da Anthropic Idioma, visão O Claude 3.5 Haiku, a próxima geração do modelo mais rápido e económico da Anthropic, é ideal para exemplos de utilização em que a velocidade e a acessibilidade são importantes. Cartão do modelo
Claude 3 Haiku da Anthropic Idioma O modelo de visão e texto mais rápido da Anthropic para respostas quase instantâneas a consultas básicas, destinado a experiências de IA perfeitas que imitam as interações humanas. Cartão do modelo
Claude 3.5 Sonnet da Anthropic Idioma O Claude 3.5 Sonnet supera o Claude 3 Opus da Anthropic numa vasta gama de avaliações da Anthropic com a velocidade e o custo do modelo de nível intermédio da Anthropic, o Claude 3 Sonnet. Cartão do modelo
Jamba 1.5 Large (pré-visualização) Idioma O Jamba 1.5 Large da AI21 Labs foi concebido para oferecer respostas de qualidade superior, elevado débito e preços competitivos em comparação com outros modelos da sua classe de tamanho. Cartão do modelo
Jamba 1.5 Mini (pré-visualização) Idioma O Jamba 1.5 Mini da AI21 Labs está bem equilibrado em termos de qualidade, taxa de transferência e baixo custo. Cartão do modelo
Mistral Medium 3 Idioma O Mistral Medium 3 é um modelo versátil concebido para uma vasta gama de tarefas, incluindo programação, raciocínio matemático, compreensão de documentos longos, resumo e diálogo. Cartão do modelo
Mistral OCR (25.05) Idioma, visão O Mistral OCR (25.05) é uma API de reconhecimento ótico de carateres para a interpretação de documentos. O modelo compreende cada elemento dos documentos, como conteúdo multimédia, texto, tabelas e equações. Cartão do modelo
Mistral Small 3.1 (25/03) Idioma O Mistral Small 3.1 (25/03) é a versão mais recente do modelo Small da Mistral, com capacidades multimodais e extensão do contexto. Cartão do modelo
Mistral Large (24.11) Idioma O Mistral Large (24.11) é a versão seguinte do modelo Mistral Large (24.07), agora com capacidades de raciocínio e de chamadas de funções melhoradas. Cartão do modelo
Codestral 2 Idioma, código O Codestral 2 é o modelo especializado de geração de código da Mistral criado especificamente para a conclusão de preenchimento do meio (FIM) de alta precisão que ajuda os programadores a escrever e interagir com o código através de um ponto final da API de instruções e conclusões partilhado. Cartão do modelo
Codestral (25.01) Código Um modelo de vanguarda concebido para a geração de código, incluindo o preenchimento de lacunas e a conclusão de código. Cartão do modelo

Abrir modelos

Os seguintes modelos abertos são oferecidos como APIs geridas no Vertex AI Model Garden (MaaS):

Nome do modelo Modalidade Descrição Início rápido
gpt-oss 120B Idioma Um modelo de 120 mil milhões de parâmetros que oferece um elevado desempenho em tarefas de raciocínio. Cartão do modelo
gpt-oss 20B Idioma Um modelo de 20 mil milhões de parâmetros otimizado para eficiência e implementação em hardware de consumo e periférico. Cartão do modelo
Qwen3-Next-80B Thinking Idioma, código Um modelo da família de modelos Qwen3-Next, especializado na resolução de problemas complexos e no raciocínio profundo. Cartão do modelo
Qwen3-Next-80B Instruct Idioma, código Um modelo da família de modelos Qwen3-Next, especializado para seguir comandos específicos. Cartão do modelo
Qwen3 Coder Idioma, código Um modelo de peso aberto desenvolvido para tarefas avançadas de programação de software. Cartão do modelo
Qwen3 235B Idioma Um modelo de peso aberto com uma capacidade de "pensamento híbrido" para alternar entre o raciocínio metódico e a conversa rápida. Cartão do modelo
DeepSeek-V3.1 Idioma O modelo híbrido da DeepSeek que suporta o modo de reflexão e o modo sem reflexão. Cartão do modelo
DeepSeek R1 (0528) Idioma A versão mais recente do modelo DeepSeek R1 da DeepSeek. Cartão do modelo
Llama 4 Maverick 17B-128E Idioma, visão O modelo Llama 4 maior e mais capaz que tem capacidades de programação, raciocínio e imagem. O Llama 4 Maverick 17B-128E é um modelo multimodal que usa a arquitetura de mistura de especialistas (MoE) e a fusão antecipada. Cartão do modelo
Llama 4 Scout 17B-16E Idioma, visão O Llama 4 Scout 17B-16E oferece resultados de vanguarda para a sua classe de tamanho, superando as gerações anteriores do Llama e outros modelos abertos e proprietários em vários testes de referência. O Llama 4 Scout 17B-16E é um modelo multimodal que usa a arquitetura de mistura de especialistas (MoE) e a fusão antecipada. Cartão do modelo
Llama 3.3 Idioma O Llama 3.3 é um modelo de 70 mil milhões de parâmetros otimizado para instruções apenas de texto que oferece um desempenho melhorado em relação ao Llama 3.1 de 70 mil milhões de parâmetros e ao Llama 3.2 de 90 mil milhões de parâmetros quando usado para aplicações apenas de texto. Além disso, para algumas aplicações, o Llama 3.3 70B aproxima-se do desempenho do Llama 3.1 405B. Cartão do modelo
Llama 3.2 (pré-visualização) Idioma, visão Um modelo multimodal de 90 mil milhões de parâmetros de tamanho médio que pode suportar o raciocínio de imagens, como a análise de tabelas e gráficos, bem como a geração de legendas de imagens. Cartão do modelo
Llama 3.1 Idioma

Uma coleção de GMLs multilingues otimizados para exemplos de utilização de diálogo multilingue e que superam muitos dos modelos de chat de código aberto e fechados disponíveis em referências comuns da indústria.

O Llama 3.1 405B está disponível de forma geral (DG).

O Llama 3.1 8B e o Llama 3.1 70B estão em pré-visualização.

Cartão do modelo

O que se segue?