O Model Garden oferece modelos abertos, de parceiros e personalizados implementados automaticamente que pode implementar e apresentar no Vertex AI. Estes modelos são diferentes das ofertas de modelo como serviço (MaaS), que são sem servidor e não requerem implementação manual.
Quando implementa modelos autonomamente, implementa-os de forma segura no seu Google Cloud projeto e rede VPC.
Implemente modelos abertos de forma autónoma
Os modelos abertos oferecem capacidades pré-treinadas para várias tarefas de IA, incluindo modelos Gemini que se destacam no processamento multimodal. Um modelo aberto está disponível gratuitamente, pode publicar livremente os respetivos resultados e pode ser usado em qualquer lugar, desde que cumpra os respetivos termos de licenciamento. O Vertex AI oferece modelos abertos (também conhecidos como open weight) e de código aberto.
Quando usa um modelo aberto com o Vertex AI, usa o Vertex AI para a sua infraestrutura. Também pode usar modelos abertos com outros produtos de infraestrutura, como o PyTorch ou o Jax.
Abrir modelos de ponderação
Muitos modelos abertos são considerados grandes modelos de linguagem (GMLs) de peso aberto. Os modelos abertos oferecem mais transparência do que os modelos que não são de ponderação aberta. Os pesos de um modelo são os valores numéricos armazenados na arquitetura da rede neural do modelo que representam padrões e relações aprendidos a partir dos dados com os quais um modelo é preparado. Os parâmetros ou os pesos pré-treinados dos modelos de peso aberto são lançados. Pode usar um modelo de ponderação aberto para inferência e otimização, enquanto os detalhes, como o conjunto de dados original, a arquitetura do modelo e o código de preparação, não são fornecidos.
Modelos de código aberto
Os modelos abertos diferem dos modelos de IA de código aberto. Embora os modelos abertos exponham frequentemente os pesos e a representação numérica principal dos padrões aprendidos, não fornecem necessariamente o código fonte completo nem os detalhes de preparação. A disponibilização de ponderações oferece um nível de transparência do modelo de IA, o que lhe permite compreender as capacidades do modelo sem ter de o criar.
Modelos de parceiros implementados autonomamente
O Model Garden ajuda a comprar e gerir licenças de modelos de parceiros que oferecem modelos proprietários como uma opção de implementação automática. Depois de comprar acesso a um modelo do Cloud Marketplace, pode optar por implementar em hardware a pedido ou usar as suas reservas do Compute Engine e descontos por utilização garantida para cumprir os requisitos do seu orçamento. É-lhe cobrado o uso do modelo e a infraestrutura do Vertex AI que usa.
Para pedir a utilização de um modelo de parceiro implementado autonomamente, encontre o modelo relevante na consola do Model Garden, clique em Contactar vendas e, em seguida, preencha o formulário, que inicia o contacto com um representante de Google Cloud vendas.
Para mais informações sobre a implementação e a utilização de modelos de parceiros, consulte o artigo Implemente um modelo de parceiro e faça pedidos de previsão.
Considerações
Tenha em atenção as seguintes limitações quando usar modelos de parceiros implementados autonomamente:
- Ao contrário dos modelos abertos, não pode exportar ponderações.
- Se tiver o VPC Service Controls configurado para o seu projeto, não pode carregar modelos, o que impede a implementação de modelos de parceiros.
- Para pontos finais, apenas o tipo de ponto final público partilhado é suportado.
Saiba mais sobre os modelos implementados autonomamente na Vertex AI
- Para saber mais sobre ponderações personalizadas, consulte o artigo Implemente modelos com ponderações personalizadas.
- Para mais informações sobre o Model Garden, consulte o artigo Vista geral do Model Garden.
- Para mais informações sobre a implementação de modelos, consulte o artigo Use modelos no Model Garden.
- Use modelos abertos Gemma
- Use modelos abertos do Llama
- Use modelos abertos da Hugging Face