A Vertex AI oferece suporte a uma lista selecionada de modelos desenvolvidos por parceiros do Google. Os modelos de parceiros podem ser usados com a Vertex AI como modelo como serviço (MaaS, na sigla em inglês) e são oferecidos como uma API gerenciada. Ao usar um modelo de parceiro, você continua enviando solicitações para endpoints da Vertex AI. Os modelos de parceiros não têm servidor, então não é necessário provisionar nem gerenciar infraestrutura.
Os modelos de parceiros podem ser descobertos usando o Model Garden. Também é possível implantar modelos usando o Model Garden. Para mais informações, consulte Explorar modelos de IA no Model Garden. As informações sobre cada modelo de parceiro disponível podem ser encontradas no card de modelo do Grupo de modelos, mas apenas os modelos de terceiros que funcionam como um MaaS com a Vertex AI estão documentados neste guia.
Os modelos Anthropic Claude são um exemplo de modelos gerenciados por terceiros disponíveis para uso na Vertex AI. Para aprender a usar os modelos de Claude, consulte Usar os modelos de Claude da Anthropic.
Desempenho previsível com garantia de capacidade
O Google oferece capacidade provisionada para modelos de parceiros que reservam capacidade de processamento para modelos por uma taxa fixa. Você decide a capacidade de processamento e em quais regiões reservar essa capacidade. Como as solicitações de capacidade de processamento provisionada são priorizadas em relação às solicitações padrão de pagamento por utilização, a capacidade de processamento provisionada fornece maior disponibilidade. Quando o sistema está sobrecarregado, as solicitações podem ser concluídas desde que a capacidade de processamento permaneça abaixo da sua capacidade reservada. Para mais informações ou para se inscrever no serviço, Entre em contato com a equipe de vendas.